首页 基于时间数据确定并行业务数量及时间区间的方法及装置

基于时间数据确定并行业务数量及时间区间的方法及装置

举报
开通vip

基于时间数据确定并行业务数量及时间区间的方法及装置(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112632154A(43)申请公布日2021.04.09(21)申请号202011609826.X(22)申请日2020.12.30(71)申请人城云科技(中国)有限公司地址310052浙江省杭州市滨江区长河街道江南大道588号恒鑫大厦主楼17层、18层(72)发明人郁强 马浩 (74)专利代理机构无锡市汇诚永信专利代理事务所(普通合伙)32260代理人曹慧萍(51)Int.Cl.G06F16/2458(2019.01)权利要求书2页说...

基于时间数据确定并行业务数量及时间区间的方法及装置
(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112632154A(43)申请公布日2021.04.09(21)申请号202011609826.X(22)申请日2020.12.30(71)申请人城云科技(中国)有限公司地址310052浙江省杭州市滨江区长河街道江南大道588号恒鑫大厦主楼17层、18层(72)发明人郁强 马浩 (74)专利代理机构无锡市汇诚永信专利代理事务所(普通合伙)32260代理人曹慧萍(51)Int.Cl.G06F16/2458(2019.01)权利要求书2页说明书9页附图2页(54)发明名称基于时间数据确定并行业务数量及时间区间的方法及装置(57)摘要本发明提供一种时间数据确定并行业务数量及时间区间的方法及装置,该方法将传统的最小时间颗粒度分片的复杂计算方式转换为二值特征数字顺序累加计算方式,在某时间节点前累加所有满足指定特征的待处理时间数据即可获取在该时间节点上的并行业务的数量,对各个时间节点的并行业务数量进行统计 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 后即可确定并行业务数量最多的时间区间,该 方案 气瓶 现场处置方案 .pdf气瓶 现场处置方案 .doc见习基地管理方案.doc关于群访事件的化解方案建筑工地扬尘治理专项方案下载 可高效且全方位地对海量时间数据进行分析挖掘,具有运算逻辑简单、计算量小、计算效率高的优势。CN112632154ACN112632154A权 利 要 求 书1/2页1.一种基于时间数据确定并行业务数量的方法,其特征在于,包括以下步骤:获取所述时间数据中的待处理时间数据;获取所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征,对应同一业务的代表相对正反意义的所述待处理时间数据被存储在同一数据表内;转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;以当前时间节点为基准,选择所述当前时间节点之前的所述待处理时间数据,累加所有所述待处理时间数据对应的所述特征数值,得到对应所述当前时间节点的并行任务数量。2.根据权利要求1所述的基于时间数据确定并行业务数量的方法,其特征在于,包括:依据分析特征处理所述待处理时间数据得到所述业务特征标志,所述分析特征以相对正反意义的特征内容表达任务内容。3.根据权利要求2所述的基于时间数据确定并行业务数量的方法,其特征在于,若所述待处理时间数据对应所述分析特征内的正向含义,所述业务特征标志为所述正向特征,若所述待处理时间数据对应所述分析特征内的反向含义,所述业务特征标志为所述反向特征。4.根据权利要求1所述的基于时间数据确定并行业务数量的方法,其特征在于,所述数据表中以所述业务时间的先后序列排列所述待处理时间数据。5.根据权利要求1所述的基于时间数据确定并行业务数量的方法,其特征在于,利用SQL将所述业务特征标志转换为二值化的所述特征数值,所述特征数值满足:单个正向特征转换得到的特征数值+单个反向特征转换得到的特征数值=0。6.根据权利要求1所述的基于时间数据确定并行业务数量的方法,其特征在于,“选择所述业务时间之前的所述待处理时间数据”之前包括:筛选符合指定特征的所述待处理时间数据,所述指定特征对应的是业务内容的特征。7.一种基于时间数据确定时间区间的方法,其特征在于,包括以下步骤:获取所述时间数据中的待处理时间数据;获取所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征,对应同一业务的代表相对正反意义的所述待处理时间数据被存储在同一数据表内;转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;以业务时间为基准,选择所述业务时间之前的所述待处理时间数据,累加所述待处理时间数据对应的所述特征数值,得到对应该业务时间的并行任务数量;选取并行任务数量最大的所述待处理时间数据为选定时间数据,以所述选定时间数据的业务时间确定时间区间。8.根据权利要求7所述的基于时间数据确定时间区间的方法,其特征在于,所述特征数值的累加操作使用所述数据库提供的窗口函数SUM来进行累加。9.根据权利要求7所述的基于时间数据确定时间区间的方法,其特征在于,“选取并行2CN112632154A权 利 要 求 书2/2页任务数量最大的所述待处理时间数据为选定时间数据,以所述选定时间数据的业务时间确定时间区间”包括:选择所述选定时间数据之前最近的正向特征对应的待处理时间数据为开始时间数据,以所述开始选定时间数据的业务时间为所述时间区间的开始时间,以所述选定时间数据为所述时间区间的结束时间。10.一种基于时间数据确定并行业务数量的装置,其特征在于,包括:数据获取 单元 初级会计实务单元训练题天津单元检测卷六年级下册数学单元教学设计框架单元教学设计的基本步骤主题单元教学设计 ,用于获取所述时间数据中的待处理时间数据,以及所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征;数据表存储单元,用于存储对应同一业务的代表相对正反意义的所述待处理时间数据;转换单元,用于转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;数量确定单元,用于以当前时间节点为基准,选择所述当前时间节点之前的所述待处理时间数据,累加所有所述待处理时间数据对应的所述特征数值,得到对应所述当前时间节点的并行任务数量。11.一种基于时间序列确定时间区间的装置,其特征在于,包括:数据获取单元,用于获取所述时间数据中的待处理时间数据,以及所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征;数据表存储单元,用于存储对应同一业务的代表相对正反意义的所述待处理时间数据;转换单元,用于转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;数量确定单元,用于循环确定业务时间的并行任务数据,以业务时间为基准,选择所述业务时间之前的所述待处理时间数据,累加所述待处理时间数据对应的所述特征数值,得到对应该业务时间的并行任务数量;区间确定单元,用于选取并行任务数量最大的所述待处理时间数据为选定时间数据,以所述选定时间数据的业务时间确定时间区间。12.一种电子设备,包括:处理器;以及存储器,在所述存储器中存储有计算机存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行根据权利要求1‑6中任一项所述的基于时间数据确定并行业务数量的方法。13.一种电子设备,包括:处理器;以及存储器,在所述存储器中存储有计算机存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行根据权利要求7‑9中任一项所述的基于时间数据确定时间区间的方法。3CN112632154A说 明 书1/9页基于时间数据确定并行业务数量及时间区间的方法及装置技术领域[0001]本发明涉及数据挖掘技术领域,特别涉及一种基于时间数据确定并行业务数量及时间区间的方法及装置。背景技术[0002]大数据挖掘,指的是从海量数据中挖掘符合指定特征的数据,并对挖掘得到的数据进行分析的一种数据处理方式。在大数据挖掘领域中,经常需要对以时间为维度的海量时间数据进行挖掘分析,挖掘分析的内容包括:确定某时间节点前满足指定特征的业务数据数量,以及,确定同时满足符合指定特征以及指定特征数量最大的两个筛选条件的时间区间,以为后续的决策提供数据支撑。而海量时间数据基本都是以秒为单位存在的,且每天、每小时、每分钟都有不确定数量的待处理时间数据产生,如何从海量时间数据中快速确定业务数据数量以及满足需求的时间区间,一直是数据挖掘领域亟需解决的技术问题。[0003]目前通用的做法是先确定最小时间颗粒度,然后再将需要分析的时间区间按照最小颗粒度进行划分,如2020年1月1日0点到2020年1月1日1点为第一个时间区间,2020年1月1日1点到2020年1月1日2点为第二个时间区间,再根据海量时间数据的待处理时间数据的时间字段内容,将待处理时间数据划分到上述的各个时间区间内,最后找出在每个时间区间内符合特征的待处理时间数据的数量,比较所有时间区间中计算的数量后,还需要考虑相邻时间区间的合并情况,最终得出需要的时间区间,整个查找逻辑非常地复杂,整个过程效率低下且出错率高,难以适用于大数据时代的海量时间数据的分析。[0004]具体的,目前确定时间区间的方式是采用将时间区间分片进行分析的方式,然而分片时间区间时就存在多种不同的情况,比如:开始时间和结束时间都在该时间区间、开始时间在但结束时间不在该时间区间、开始时间不在但结束时间不在该时间区间、开始时间和结束时间均不在该时间区间的情况,导致整个计算逻辑复杂繁琐。且,在这种方式中,若时间区间的间隔缩小将导致计算量成倍级的增加,按分钟分片的计算量是按小时分片的60倍,按秒分片的计算量是按分钟分片的60倍,是按小时分片计算量的3600倍,也就是说时间区间的间隔越小对应的计算量越大、计算逻辑越复杂。不仅如此,该方式只能按照指定的分片颗粒度进行统计,无法按照实际的发生时间来分析时间范围,也只能通过编程语言代码如java来实现,技术门槛高。[0005]以在线会议系统产生的时间数据为例进行分析,经常需要分析最大并行会议(同时在线的会议,已经开始还没有结束的会议)发生的时间区间,若用传统的方式时,在找出每个时间段区间内并行会议的数据数量时,则需要考虑会议开始时间不在当前时间区间的、会议开始时间在当前时间区间的、会议结束时间不在当前时间区间的、会议结束时间在当前时间区间的等各种情况,导致系统运算逻辑混乱且低效。发明内容[0006]本发明的目的在于提供一种基于时间数据确定并行业务数量及时间区间的方法4CN112632154A说 明 书2/9页及装置,该方法将传统的最小时间颗粒度分片的复杂计算方式转换为二值特征数字顺序累加计算方式,在某时间节点前累加所有满足指定特征的待处理时间数据即可获取在该时间节点上的并行业务的数量,对各个时间节点的并行业务数量进行统计分析后即可确定并行业务数量最多的时间区间,该方案可高效且全方位地对海量时间数据进行分析挖掘,具有运算逻辑简单、计算量小、计算效率高的优势。[0007]为实现以上目的,本技术方案提供一种基于时间数据确定并行业务数量的方法,包括以下步骤:[0008]获取所述时间数据中的待处理时间数据;[0009]获取所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征,对应同一业务的代表相对正反意义的所述待处理时间数据被存储在同一数据表内;[0010]转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;[0011]以当前时间节点为基准,选择所述当前时间节点之前的所述待处理时间数据,累加所有所述待处理时间数据对应的所述特征数值,得到对应所述当前时间节点的并行任务数量。[0012]第二方面,提供一种基于时间数据确定时间区间的方法,包括以下步骤:[0013]获取所述时间数据中的待处理时间数据;[0014]获取所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征,对应同一业务的代表相对正反意义的所述待处理时间数据被存储在同一数据表内;[0015]转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;[0016]以业务时间为基准,选择所述业务时间之前的所述待处理时间数据,累加所述待处理时间数据对应的所述特征数值,得到对应该业务时间的累加数值,循环得到对应每一业务时间的累加数值;[0017]选取并行任务数量最大的所述待处理时间数据为选定时间数据,以所述选定时间数据的业务时间确定时间区间。[0018]第三方面,提供一种基于时间数据确定并行业务数量的装置,执行上述基于时间数据确定并行业务数量的方法。[0019]第四方面,提供一种基于时间数据确定时间区间的装置,执行上述基于时间序列数据确定时间区间的方法。[0020]第五方面,提供处理器;以及存储器,在所述存储器中存储有计算机存储器,在所述存储器中存储有计算机程序指令,所述计算机程序指令在被所述处理器运行时使得所述处理器执行上述方法。[0021]相较现有技术,本技术方案具有以下特点和有益效果:[0022]重新定义指定特征:将指定特征转换为意义相反的二值特征内容,以将复杂的分析逻辑转换为相反的二值数字计算,比如指定特征可转换为满足/不满足,或者是/否、进/出、开始/结束等二值特征内容; 标准 excel标准偏差excel标准偏差函数exl标准差函数国标检验抽样标准表免费下载红头文件格式标准下载 化转换待处理时间数据:将具有相反二值特征内容的5CN112632154A说 明 书3/9页待处理时间数据 记录 混凝土 养护记录下载土方回填监理旁站记录免费下载集备记录下载集备记录下载集备记录下载 在同一张记录表内,至少记录待处理时间数据的业务时间以及特征标志字段,特征标志字段转换为二值特征内容,并将特征标志字段依据内容数字化处理得到特征标志数字,代表相反意义含义的特征标志数字可叠加抵消;将业务时间节点前所有的待处理时间数据的特征标志数字进行叠加,即可获取在当前业务时间节点之前所有的并行业务数量。对这些并行业务数量进行统计分析,即可确定满足并行业务数量最多的时间区间。[0023]本方案以业务的起始和终止为参考,将单个业务的起止转换为可计算的数值,具体的,将对应业务的待处理时间数据转换为可相互抵消的特征标志数字,通过简单的数字累加计算即可轻松地获取截止时间点之前的并行业务的数量,解决了传统时间区间分析过程中的确定最小颗粒度、数据按时间分片、大量循环计算的低效问题。且,该方法的适用范围广,可以适用任何能转换为二值特征的时间区间分析问题,以解决快速满足最大指定特征业务数量的时间区间的确定,如根据停车场车辆进出记录计算停车场在什么时间范围内剩余车位最多、占用率最多、周转率最大;会议系统根据会议开始和结束记录计算会议系统在什么时候同时进行的会最多;根据某段高速公路进出卡扣的车辆记录计算在什么时间范围中高速路上的车最多等各种实际问题。附图说明[0024]图1是根据本方案的基于时间数据确定并行业务数量的方法流程示意图。[0025]图2是根据本方案的基于时间数据确定时间区间的方法流程示意图。[0026]图3到图5是本方案的基于时间数据确定时间区间的应用示意图。具体实施方式[0027]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。[0028]本方案提供一种基于时间数据确定并行业务数量及基于时间数据确定时间区间的方法,此处的“时间数据”指的是至少两以时间为序列的待处理时间数据,同一业务在运行过程中以时间为排布序列产生系列的待处理时间数据,不同业务产生业务内容字段不同的待处理时间数据,多个待处理时间数据组成时间数据。待处理时间数据至少包括业务时间字段和业务特征标志,其中业务时间字段用于确定该待处理时间数据的产生时间,业务特征标志用于确定该业务的业务内容。此处确定的“并行业务”指的是满足指定特征的业务,此处确定的“时间区间”指的是满足并行业务数量最多的时间区间。[0029]另外,本方案利用SQL技术(结构化查询语言,Structured Query Language,是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统;同时也是数据库脚本文件的扩展名),应用SQL的快速查询功能,从标准化的数据表中查找满足指定特征的待处理时间数据并采用累加的方式进行计数,在本方案中并不需要预先对时间进行最小颗粒度定义和分片,不需要单独循环每条数据进行统计,也不需要使用高级编程语言进行开发编译。6CN112632154A说 明 书4/9页[0030]具体的,由于SQL技术可以通过数据查询引擎使用数据表中预先创建好的索引,发挥分布式数据查询引擎的并行查询性能,内置窗口函数查询优化机制,并通过对需要分析的大量数据的批量预处理和累加计算,将按最小颗粒度分片复杂计算转换为顺序累加计算,因此使得该方案能够高效以及全方位的对海量的数据进行分析挖掘,解决大数据项目中的确定并行业务数量以及时间区间的问题。[0031]第一方面,本方案提供一种基于时间数据确定并行业务数量的方法,该方法依据业务起止内容将业务对应的待处理时间数据转换为可计算的二值数字,并通过累加计算二值数字的方式确定并行业务的数量。本方案将业务的起始和终止以清楚的二值化数字进行表示,当某一业务终止时通过负值抵消累加数量,巧妙的利用叠加抵消的数字计算方法获取并行业务的数量。第二方面,本方案提供一种在海量时间数据中快速确定时间区间的方法,该方法在获取并行业务数量的基础上对并行业务数量进行统计,以确定并行业务数量最多的时间区间。[0032]第一方面,本方案介绍一种基于时间数据确定并行业务数量的方法,包括以下步骤:[0033]获取所述时间数据中的待处理时间数据;[0034]获取所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征,对应同一业务的代表相对正反意义的所述待处理时间数据被存储在同一数据表内;[0035]转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;[0036]以当前时间节点为基准,选择所述当前时间节点之前的所述待处理时间数据,累加所有所述待处理时间数据对应的所述特征数值,得到对应所述当前时间节点的并行任务数量。[0037]本方案可适用于海量的时间数据的挖掘和分析,由于本方案的计算逻辑简单故其应用于海量时间数据的分析时,具有压力小、效率高等优点。[0038]对应的,本方案可从任意类型的数据源中来获取需要分析的海量的时间数据,可以是各种关系型数据库Mysql等、分布式数据库PostgreSql等、数据仓库Hive等不同类型的数据库,根据数据库的服务地址、端口、用户名、密码、数据库实例信息连接到数据源,进而从数据源中需要挖掘分析的时间数据。[0039]值得一提的是,本方案的待处理时间数据包括对应特定业务的业务时间以及业务特征标志。在一些实施例中,需要依据分析特征对待处理时间数据进行处理,以获取所述业务时间以及所述业务特征标志。[0040]对应的,该方案包括依据分析特征处理所述待处理时间数据得到所述业务特征标志,所述分析特征以相对正反意义的特征内容表达任务内容。所述分析特征的字段内容包括表达任务内容的代表相反正反意义的成对特征词。[0041]进一步的,若所述待处理时间数据对应所述分析特征内的正向含义,所述业务特征标志为所述正向特征,若所述待处理时间数据对应所述分析特征内的反向含义,所述业务特征标志为所述反向特征。[0042]在一些实施例中,所述正向特征选用所述分析特征表示正向含义的特征词,所述7CN112632154A说 明 书5/9页反向特征选用所述分析特征表示反向含义的特征词。当然正向特征和反向特征可用不同于特征词的词汇表示。[0043]所述分析特征的所述成对特征词可以是:对一定条件的满足/不满足,或者是/否、进/出、开始/结束等。[0044]示例性的,若任务内容是“同时在线的在线会议”,则对应的分析特征为“会议开始但未结束”,对应的正向特征为“开始”,对应的反向特征为:“结束”;若任务内容是“停车场内的停车数量”,则对应的分析特征为:“进入停车场但未驶出停车场”,对应的正向特征为“进入”,对应的反向特征为“驶出”。若任务内容是“演唱会内的观众数量”,则对应的分析特征为“观众进入演唱会场但未从演唱会场出来”,对应的正向特征为“进入”,反向特征为“出来”。[0045]值得一提的是,若获取的任务内容本身已用代表相对正反含义意义的内容表示,则不再需要转换任务内容。若并不是,则需要将将任务内容的任务特征转换为任务内容的任务特征转换为由相对正反意义的内容组成的分析特征。示例如上所述,在此不做其他解释。[0046]“对应同一业务的代表相对正反意义的所述待处理时间数据被存储在同一数据表内”的目的在于便于SQL语言从数据表中提取所述的数据源数据。由于获取的待处理时间数据由多种结构定义模式,这样不便于后续对待处理时间数据进行后续处理,故本方案将代表相对正反意义的所述待处理时间数据都汇总到同一数据表内,数据表的字段结构的示意如下表一所示:[0047]表一数据表的结构字段示意图[0048]业务时间业务特征标识XX年x1月正向特征XX年x2月正向特征XX年x3月反向特征XX年x4月反向特征[0049]以在线会议的待处理时间数据为例,可能存在:会议开始时间和结束时间在同一条记录中;或会议开始时间在一张表中,会议结束时间在另外一张表中,通过会议号码匹配;或会议开始记录和会议结束记录在一张表中,通过会议号匹配等各种情况,需要通过以上的方式将其标准统一。[0050]值得一提的是,相反业务特征标志的待处理时间数据记录在同一张数据表内,且时间数据源至少包括业务时间以及业务特征标志。该所述数据表中以所述业务时间的先后序列排列所述待处理时间数据。由于本方案不需要获知具体的业务内容,仅获取业务的起始和终止时间即可分析并行业务,也从侧面降低了服务器的计算成本。[0051]“转换所述业务特征标志为特征数值”包括利用SQL提供的标准关键字将所述业务特征标志统一转换为所述特征数值,所述业务特征标志可以是汉字、英文、字符、数字等多种形式表示,利用SQL将其统一转换为二值化的所述特征数值,值得一提的是,所有的所述正向特征转换为同一特征数值,所有的所述反向特征也转换为同一特征数值。所述特征数值满足:单个正向特征转换得到的特征数值+单个反向特征转换得到的特征数值=0。[0052]在本方案的实施例中,所述正向特征转换得到正值的特征,所述反向特征转换得8CN112632154A说 明 书6/9页到负值的特征。比如正值的特征为1,负值的特征为‑1。[0053]当前时间节点可以是业务节点,也可以不是业务节点。所有所述待处理时间数据对应的所述特征数值的值就是并行任务的数量。[0054]另外,在本方案中可先对待处理时间数据进行筛选后再进行分析,此时,在“选择所述业务时间之前的所述待处理时间数据”之前包括:筛选符合指定特征的待处理时间数据,此处的指定特征对应的是业务本身的业务内容的特征,不同于其上的分析特征。在本方案中可通过SQL提供的标准关键字WHERE根据实际业务分析挖掘的需要,从海量的待处理时间数据中进行数据筛选,缩小数据的计算范围,过滤条件需要选取有索引的字段,以加快计算效率。[0055]第二方面,本方案提供一种基于时间数据确定时间区间的方法,包括以下步骤:[0056]获取所述时间数据中的待处理时间数据;[0057]获取所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征,对应同一业务的代表相对正反意义的所述待处理时间数据被存储在同一数据表内;[0058]转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;[0059]以业务时间为基准,选择所述业务时间之前的所述待处理时间数据,累加所述待处理时间数据对应的所述特征数值,得到对应该业务时间的累加数值,循环得到对应每一业务时间的累加数值;[0060]选取并行任务数量最大的所述待处理时间数据为选定时间数据,以所述选定时间数据的业务时间确定时间区间。[0061]“以业务时间为基准,选择所述业务时间之前的所述待处理时间数据,累加所述待处理时间数据对应的所述特征数值,得到对应该业务时间的累加数值”包括:选定业务时间为当前业务时间,找出小于所述业务时间的待处理时间数据,将所有所述待处理时间数据对应的特征数值进行累加,得到截止当前业务时间时依旧存在的业务。若累加数值为1,则表示只有第一个业务依旧存在;若累加数值为0,则表示没有业务。即,所述累加数值对应截止当前业务时间的处于正向特征的业务数量。[0062]循环得到对应每一业务时间的累加数值包括:待处理时间数据依据时间序列排序,自先往后选择业务时间进行累加计算,直至所有待处理时间数据被累加操作。[0063]特征数值的累加操作可以使用数据库提供的窗口函数SUM来进行累加,sum(特征标志数字)over(partition by 1order by业务日期),这样可以充分利用数据库的并行计算资源,加快海量数据的计算速度。累加后形成一个新的累加数量字段,表示截止到当前时间节点的并行业务的数量。[0064]“选取并行任务数量最大的所述待处理时间数据为选定时间数据,以所述选定时间数据的业务时间确定时间区间”包括:选择所述选定时间数据之前最近的正向特征对应的待处理时间数据为开始时间数据,以所述开始选定时间数据的业务时间为所述时间区间的开始时间,以所述选定时间数据为所述时间区间的结束时间。[0065]所述选定时间数据为并行任务数量最大的时间点,对应的,获取该时间点之前最近的另一业务开始的时间点,即可获取并行任务数量相较其他时间段最大的时间区间。9CN112632154A说 明 书7/9页[0066]第三方面,本方案提供一种基于时间数据确定时间区间的应用,以在线会议系统为例进行说明,若需确认在线会议并行任务最大的时间区间:[0067]首先确定需要分析的分析特征,所述分析特征为:会议开始了但没结束;[0068]依据所述分析特征标准化在线会议的待处理时间数据,得到如图3所述的数据表,所述待处理时间数据表示为:①业务时间:2020‑11‑02 08:59:53业务特征标志:开始;②业务时间:2020‑11‑02 09:18:37业务特征标志:结束;③业务时间:2020‑11‑02 12:10:41业务特征标志:开始;④业务时间:2020‑11‑02 15:03:52业务特征标志:开始;⑤业务时间:2020‑11‑02 21:02:13业务特征标志:结束。[0069]转换业务特征标志为特征数值,得到如图4所示的数据表,所述待处理时间数据表示为①业务时间:2020‑11‑02 08:59:53业务特征标志:开始;特征数值:1②业务时间:2020‑11‑02 09:18:37业务特征标志:结束;特征数值:‑1③业务时间:2020‑11‑02 12:10:41业务特征标志:开始;特征数值:1④业务时间:2020‑11‑02 15:03:52业务特征标志:开始;特征数值:1⑤业务时间:2020‑11‑02 21:02:13业务特征标志:结束,特征数值:‑1。[0070]以业务时间为基准累加特征数值得到累加数值,得到如图5所示的数据表,①业务时间:2020‑11‑02 08:59:53业务特征标志:开始;特征数值:1;累加数值:1②业务时间:2020‑11‑02 09:18:37业务特征标志:结束;特征数值:‑1;累加数值:0③业务时间:2020‑11‑02 12:10:41业务特征标志:开始;特征数值:1;累加数值:1④业务时间:2020‑11‑02 15:03:52业务特征标志:开始;特征数值:1;累加数值:2⑤业务时间:2020‑11‑02 21:02:13业务特征标志:结束,特征数值:‑1;累加数值:1。[0071]根据累加数值统计得到最大数量,并基于所述最大数量反推时间区间:图5中的累加数量2就是最大同时进行中的会议数量,累加数量2对应的时间2020‑11‑02 15:03:52就是结束时间,结束时间的上一个业务时间2020‑11‑0212:10:41就是开始时间,在2020‑11‑02 12:10:41到2020‑11‑02 15:03:52的时间范围内,同时进行中的会议数量为2个,是统计分析范围内的最大同时进行中的会议数量。[0072]第四方面,本方案提供一种基于时间数据确定并行业务数量的装置,该装置用于执行上述的基于时间数据确定并行业务数量的方法,包括:[0073]数据获取单元,用于获取所述时间数据中的待处理时间数据,以及所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征;[0074]数据表存储单元,用于存储对应同一业务的代表相对正反意义的所述待处理时间数据;[0075]转换单元,用于转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;[0076]数量确定单元,用于以当前时间节点为基准,选择所述当前时间节点之前的所述待处理时间数据,累加所有所述待处理时间数据对应的所述特征数值,得到对应所述当前时间节点的并行任务数量。[0077]关于基于时间数据确定并行业务数量的装置的运行方法参见其上关于基于时间数据确定并行业务数量的方法的内容陈述,本申请人在此不作过多累赘的说明。[0078]第五方面,本方案提供一种基于时间序列确定时间区间的装置,该装置用于执行10CN112632154A说 明 书8/9页上述的基于时间数据确定时间区间的方法,包括:[0079]数据获取单元,用于获取所述时间数据中的待处理时间数据,以及所述待处理时间数据中对应特定业务的业务时间以及业务特征标志,所述业务特征标志为代表相对正反意义的正向特征或反向特征;[0080]数据表存储单元,用于存储对应同一业务的代表相对正反意义的所述待处理时间数据;[0081]转换单元,用于转换所述业务特征标志为特征数值,所述正向特征和所述反向特征对应的所述特征数值叠加被抵消;[0082]数量确定单元,用于循环确定业务时间的并行任务数据,以业务时间为基准,选择所述业务时间之前的所述待处理时间数据,累加所述待处理时间数据对应的所述特征数值,得到对应该业务时间的并行任务数量;[0083]区间确定单元,用于选取并行任务数量最大的所述待处理时间数据为选定时间数据,以所述选定时间数据的业务时间确定时间区间。[0084]同理,关于基于时间数据确定并行时间区间的装置的运行方法参见其上关于基于时间数据确定时间区间的方法的内容陈述,本申请人在此不作过多累赘的说明。[0085]用于实现本方案实施例时间数据确定并行业务数量及时间区间的方法的服务器的计算机系统包括中央处理单元(CPU),其可以根据存储在只读存储器(ROM)中的程序或者从存储部分加载到随机访问存储器(RAM)中的程序而执行各种适当的动作和处理。在RAM中,还存储有系统操作所需的各种程序和数据。CPU、ROM以及RAM通过总线彼此相连。输入/输出(I/O)接口也连接至总线。[0086]特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的时间数据确定并行业务数量及时间区间的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)执行时,执行本发明的时间数据确定并行业务数量及时间区间的方法。[0087]附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。[0088]描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的模块也可以设置在处理器中。[0089]作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使11CN112632154A说 明 书9/9页得该设备执行时间数据确定并行业务数量及时间区间的方法所对应的流程步骤。[0090]上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。12CN112632154A说 明 书 附 图1/2页图1图213CN112632154A说 明 书 附 图2/2页图3图4图514
本文档为【基于时间数据确定并行业务数量及时间区间的方法及装置】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥10.0 已有0 人下载
最新资料
资料动态
专题动态
机构认证用户
掌桥科研
掌桥科研向科研人提供中文文献、外文文献、中文专利、外文专利、政府科技报告、OA文献、外军国防科技文献等多种科研资源的推广、发现、揭示和辅助获取服务,以及自动文档翻译、人工翻译、文档格式转换、收录引证等科研服务,涵盖了理、工、医、农、社科、军事、法律、经济、哲学等诸多学科和行业的中外文献资源。
格式:pdf
大小:728KB
软件:PDF阅读器
页数:14
分类:
上传时间:2022-01-25
浏览量:0