华泰证券大规模数据高速查询与回放系统项目
需求背景与研发内容
在金融证券、软件系统压力测试等应用中,存在很多需要对大规模历史数据进行回放的服务需求,例如,股票量化分析平台、系统数据回测平台中,就存在很多这种数据回放服务需求,以便于进行回归测试分析;或者通过历史数据进行软件系统压力测试。
针对上述应用需求和问题背景,研究构建了一种通用化的大数据回放模型与框架,并基于该模型与框架设计实现了一个高效的大规模数据高速查询与回放系统。
功能简介/特性
支持底层多种异构数据源:系统对数据输入进行了统一抽象,可支持对异构数据源中历史数据进行回放处理,如文件系统、传统SQL数据库、NoSQL数据库等。
方便易用的回放操作:提供了简单易用的回放操作符,用户可直接对操作符进行适当组合从而定义回放作业逻辑。回放操作符包括数据加载操作符、数据流合并操作符以及流处理操作符等,可简单快速创建数据回放作业。
稳定且可调节的回放速率:允许用户指定特定回放速率,并由回放平台自身保证在回放过程中该速率的服务质量,执行某些具有速率要求的模拟回放作业。
高可扩展性:系统具有很高的数据扩展性和系统扩展性,可很好地支持大规模数据、多用户高并发数据回放服务。
江苏12345公众在线服务平台智能分析项目
需求背景与研发内容
本项目依托南京大学PASA大数据实验室与江苏鸿程大数据技术与应用研究院,综合采用“大数据+人工智能”技术,从“热点主题分析”、“突发事件检测”等多个角度,对海量数据进行智能化分析和价值挖掘,掌握民生热点需求,助力政务服务。
功能简介/特性
热点主题分析:发现群众关心的热点和难点问题。
突发事件检测:强化对于突发事件与苗头事件的整体把握,对民生热点问题在第一时间内形成督办。
用户画像:提供个性化、便捷化的政务服务,实现“千人千面”。
不规范工单筛查:发现不符合数据标准规定的诉求工单,提升政务服务部门效率。
国家审计署环渤海地区污染现状智能分析应用
需求背景与研发内容
针对国家审计署对于环渤海污染状况智能分析的迫切需求,本项目依托南京大学PASA大数据实验室与江苏鸿程大数据技术与应用研究院,综合采用“大数据+人工智能”技术,对有关环渤海地区污染现状的新闻、博客、论坛等数据进行自动爬取与智能研判,自动化分析识别出大量潜在疑似污染企业与地区,为审计工作提供有效审计线索。
功能简介/特性
网络数据爬取:利用网络爬虫技术从互联网中采集海量环渤海地区污染相关新闻数据。
污染企业与地区识别:采用命名实体抽取、文本语义分析等多项自然语言处理相关技术与方法自动发现潜在的污染企业与地区。
线索关联分析:建立污染企业、污染地区与污染时间的关联关系,从宏观与微观两个视角把握污染现状的整体走势与突出问题。
智能 制造- - 电动汽车电池安全智能管理
主要研究开发内容
电动汽车的安全管理核心是电池组的安全管理。电池组的安全管理最重要的是预测电池组是否会发生电压超高故障。
如果可以提前预测电池组的故障发生,电动车管理模块就可以及早实施保护动作。
本项目根据江苏物联科技所拥有的上百辆电动汽车多年积累的传感器数据研发电池组过压故障的预测模型。该模型通过一辆电动汽车历史历史的行车数据预测未来一周内该车的电池组是否会发生故障。
功能简介/特性
特征选择:采用能量特征、熵特征、傅里叶变换特征、自相关特征、特殊统计值、分位数特征等共7大类特征构造思路,30种时序特征的构造方法,多达上千维候选特征。
自动化建模:采用研究院特色的AutoML系统实现高质量的模型训练。
级联特征选择:为了从大量特征中高效选出高质量特征,提出并行级联特征选择技术。
注:目前正在和相关企业继续在更大规模的数据集上展开模型能力POC验证,在样本数据集上模型AUC指标可达0.86。
地铁 大数据智能化分析监测与预警系统
需求背景与研发内容
地铁车辆与轨道设施部件众多,在运行使用中部件会随着使用时间出现各种故障。而核心部件故障可能会造成严重事故。传统检测方法依靠人工,劳动量大,效率低下。
目前车辆与轨道设施关键部件均安装有传感设备,可以及时采集部件的运行数据。
为此,可以利用所采集的车辆和轨道设施的实时数据,基于大数据+人工智能技术,及时分析、监测、以及提前预测预警车辆和轨道故障。
功能简介/特性
地铁大数据存储管理:提供地铁系统数据采集汇聚和存储管理系统,开发和构建地铁系统统一大数据存储管理与计算系统平台,可有效存储管理车辆运行和轨道环境相关的各类数据。
地铁系统智能化故障检测:提供地铁系统大数据智能化故障分析监测算法模型,包括车辆关键部件与轨道系统运营状况监测与故障诊断算法模型,并可根据每天、每周、每月等不同时间段所积累的地铁系统数据,完成全量和增量式数据分析检测与诊断。
地铁系统故障预测与预警:在分析检测已有故障的基础上,根据部件运行数据,进一步分析预测即将或临近发生故障的部件,提前做出预报和预警,减少或避免因故障发生导致重大安全事故。
注:本项目为第一期探索使用项目,已初步完成车辆和轨道核心部件故障分析检测和预警算法模型的POC验证研发,验证了技术方法和算法模型的有效性,目前进入第一期的落地系统开发和实施。
电网信息系统智能运维大数据分析应用
需求背景与研发内容
故障诊断和分析是运维中的重要部分。在由大量设备构成的复杂系统中,当某个服务有问题时,其可能会触发多个维度的事件,由此引发许多的设备同时发出告警信息,形成“报警风暴”。另外,系统运行时产生的大量系统日志也难以仅通过人工分析,这使得对系统故障的分析和排查变得困难。
本产品构建了智能故障分析系统,可以快速、高效地找到故障根源,以降低故障持续时间,减小故障带来的损失,提高系统的可用性。
功能简介/特性
故障根因分析:使用向上归因的方法,分析出报警风暴中的可疑点,以找出故障产生的根本原因。还可以根据节点可疑值大小,检测出未报警的异常点。
系统异常关联分析:根据结点类型和报警内容等信息建立“语义字典”,以准确分析故障传播的规则自动挖掘异常关联性,给出可能的故障根源链路。
日志数据智能分析:对系统日志进行模板提取、分类合并等操作,并将故障链路可视化,帮助运维人员直接定位错误日志中的关键信息。
注:设计实现了基于人工智能+图计算的信息系统故障诊断和分析方法、以及智能运维系统