当前位置:首页 >科技成果列表> 科技成果详细

基于Spark的大规模短语翻译模型的训练方法

技术类型:发明专利

技术成熟度:正在研发

转让方式:技术转让、技术许可、技术入股

同类技术:

合作案例:

交易价格:面议

应用领域:通用仪器仪表制造

技术领域:-

专利基本信息
专利名称 基于Spark的大规模短语翻译模型的训练方法
专利状态 公开号 CN201610346396.4
申请号 专利申请日期 2016-05-23
专利授权日期 2016-10-26 专利权届满日
专利所属地 中国 专利类型 发明专利
发明人 黄宜华;周娟;顾荣;杨文家;黄书剑
权利人
专利摘要 本发明公开了一种基于Spark的大规模短语翻译模型的训练方法,包括以下步骤:首先采取Spark分布式地调用单机多线程词对齐训练工具MGIZA++的模式,在大规模平行语料库中使用期望最大化算法进行词对齐模型的迭代训练,生成带有词对齐信息的平行语料库;接着使用上一步生成的带有词对齐信息的双语语料数据,在Spark平台上实现了短语翻译模型的并行化训练,最终得到短语表。本发明提出了一种基于Spark的大规模翻译模型的训练方法,解决了现有翻译系统在翻译模型训练中耗时较长、数据扩展性不佳的问题。
成果概况
简介

本发明公开了一种基于Spark的大规模短语翻译模型的训练方法,包括以下步骤:首先采取Spark分布式地调用单机多线程词对齐训练工具MGIZA++的模式,在大规模平行语料库中使用期望最大化算法进行词对齐模型的迭代训练,生成带有词对齐信息的平行语料库;接着使用上一步生成的带有词对齐信息的双语语料数据,在Spark平台上实现了短语翻译模型的并行化训练,最终得到短语表。本发明提出了一种基于Spark的大规模翻译模型的训练方法,解决了现有翻译系统在翻译模型训练中耗时较长、数据扩展性不佳的问题。

智教智学项目-综合型智能化的教育平台
公司是一家以软硬件开发、大数据运算、AI赋能、脑科学研究、神经学研究、生物研究、医学研究、农业科学研究以及自然科学研究为一体的智能型科技化的平台企业。 项目主要模式是以教学场景软硬件为切入口,全面建设数字化内容,结合数据分析、课堂软硬件设施全方位的为教师、学生、学校、家长、教委打造课前、课中、课后各个环节的综合信息化的教学监测与评估,同时家长通过手机端即可实习家校共育的同步。通过阶段性大数据的分析判断,推演出符合此阶段学生的生物特征、智力水平的教研模式,使得知识点的前后逻辑结构、每个知识点的输出时长、技巧、方法等的调整同步各个时代的学生的各项特征和水平。 项目优势:课堂教学稳定可控,备、教、辅、测、评教学环节全覆盖,与教育云平台资源互联互通。
领域:Web服务与集成软件
助力制造业数字化升级,工业元宇宙智慧化平台
通过数字孪生与人工智能算法技术,打造工业元宇宙智慧平台,为制造业提供数字化转型解决方案,集成数字工厂、工业元宇宙园区、元宇宙展会、工业三维示教系统、VR/AR解决方案等功能定制化建设。 工业元宇宙智慧化平台,以可视孪生基座,联动高性能数据,打造元动工业元宇宙智慧化平台,落地于多领域场景应用。产品优势:拥有高保真、高沉浸、高物理的渲染核心技术,采用世界领先的虚幻引擎进行底层拓展;首家在航空工业领域,提出数字智慧化解决方案,同时拥有制造业多领域数字化经验;率先将工业元宇宙落地,已有打造车企工业元宇宙厂区的案例;使用便捷、管理清晰、长效稳定,形成长效生产力工具,落地新经济对于企业的赋能。
领域:软件
一站式数字藏品资产管理平台 Web3.0时代入口级应用——数藏卡包
平台以数藏卡包为核心切入点,为千万级数字藏品爱好者提供一站式数字藏品资产管理服务,其中包括:跨平台查看资产、自动化高效流转等。在帮助广大藏家解决数字藏品资产管理繁琐问题的同时也实现可靠性、合规性强的数字资产流转。平台通过海量的藏品流转以及藏家流量来实现增值收益变现。 项目产品是一站式数字藏品资产管理平台解决方案,为藏家提供数字藏品聚合管理服务,一站式查看、管理多平台数字藏品;为藏家提供高效、自动化藏品流转,藏家安全、可靠、合规地实现藏品流转;为数字藏品发售平台提供代销服务,扶植中小平台,让优质数字藏品更多曝光;为更好匹配发售平台和IP,通过藏家众筹的方式做发售前调研,为双方合作提供数据支撑。
领域:Web服务与集成软件
吸收自然能量,开启绿色冷源
公司是一家从事蒸发式制冷、数据中心节能、工 业余热利用等集系统研发、生产、销售、合同能源管理和售后服务为一体的高新技术企业。公司拥有五大系列产品,几十项发明和实用新型专利,专业的运营和工程服务团队,已成为中国联通、中国移动、 中国电信、中国广电等运营商的重要节能合作伙伴。间接蒸发式制冷产品包括直接蒸发/间接蒸发/多级间接蒸发/高温冷水机组/溶液调湿/金属芯体等全系列大中小型产品,定位于运营商定制化改造项目,市场潜力巨大。
领域:能源系统管理、优化与控制技术
亚临界水解发酵饲料
项目以亚临界水解系统把有机物碳氢分子链打断,搭配专属发酵系统及功能肽,利用低价原料组合,形成高营养、易吸收的新型饲料。由于纤维素的多糖被部分取出,加上蛋白质和脂肪的营养分子细化,因此原料组合和成本结构发生剧烈改变。运用生物技术以精密发酵连结生物菌制程等现代生物技术,把各种动植物有机废弃物进行回收利用,能稳定制造符合饲料营养标准的低成本多肽发酵饲料,用于鸡、鸭、猪、鱼虾等禽畜类及水产类养殖,降低超过20%的饲料成本,大幅增加养殖户的获利能力及抗风险能力。
领域:农业生物技术
“TOC” 智动化工厂先行者【保密】
依托福耀玻璃、实达电脑、比亚迪、霍尼韦尔等工业大厂人才资源,以分布式前置仓为切入场景,聚焦新能源汽车供应链补链环节。项目将BOM由“物料管理”升级为“工艺包”管理,提升仓配效率,并由MRO根据时效性要求进行梯次仓配管理,降低采购隐形成本;整合本地第三方仓储供应商、本地五金店一条街资源,做标准化高效率的EDI仓和物理仓结合,更好为主机厂提供价值,降本增效;与MRO电商平台互补,用前置仓完成最后一公里覆盖,做末端服务;数据采集到EDI仓做分析,关注新能源车产业链未实现木地化配套的环节,用前置仓的方式发挥“补链”作用,构建围绕主机厂的“最后一公里供应链生态”。
领域:机器人
分布式电源接入配电网综合评价软件
项目针对配电系统的拓扑结构和运行特性, 深入研究了分布式电源接入配电网后的可靠性评估算法,并在此基础上分析对比了分布式电源接入对配电网可靠性的影响。
行业:电力、热力生产和供应业,电力供应
智能技术扩展模块-STX模块解决方案
 STX模块是高度集成的多功能处理模块系统(SoM),具有全面的计算能力。尽管STX模块根据不同的功能和能源结构进行配置,但该模块总是需要通过输出接口进行配置,并与基板配合工作。STX与PC/104尺寸相同,都是3.6"x3.8",并使用相同的4个底座孔。
行业:批发业,其他批发业
工业4.0与数字孪生
DataMesh以产品全生命周期数据为基础,对产品生产过程进行模拟仿真、评估和优化,并进一步扩展整个产品生命周期管理,帮助企业构建出新型的生产组织方式。 DataMesh工业PaaS平台结合企业CAD应用,以高效的3D培训编辑器通过混合现实快速构建培训、仿真场景,帮助多用户基于真实设备模拟操作步骤与交互环节,构建Digital Twin数字孪生解决方案。
行业:其他制造业,其他未列明制造业
建筑空间智慧能源管理解决方案
通过人工智能仿真式和试探式机器学习技术,解决能耗大、舒适度不均等问题,实现安全、舒适、节能、高效;
行业:软件和信息技术服务业,软件开发
消防装备全寿命智能化管理系统
装备全寿命智能化管理系统依托物联网、人工智能、虚拟现实(VR)等技术,构建全新的现代化消防管理、指挥机制。系统通过灵活、有效的管理部署,实现消防装备全寿命周期的管理;实现消防装备管理的动态化、智能化、精准化,大大提高管理效率。同时,结合当前和未来灭火救援、抢险救灾实际需要,全方位、立体化拓展系统功能,形成装备“大数据”,为装备采购、配发、维护保养等提供数据支持及辅助决策。
行业:软件和信息技术服务业,信息处理和存储支持服务
高科技电子PLM解决方案
高科技电子行业PLM解决方案是基于InforCenter软件系统,以产品数据为核心,集成所有与产品有关的数据和过程的研发管理平台。在PLM标准功能基础上针对企业关键业务进行了深入处理,实现了企业普遍关注的SJT207等行业标准体系、IPD研发过程管理、机电软协同设计、物料选型、行业知识积累等关键业务的支持,为企业搭建企业产品设计管理平台,实现对新产品开发过程的全局性管理。
行业:软件和信息技术服务业,信息系统集成和物联网技术服务
夹层软土技术的高校资源
夹层软土技术的高校资源
夹层软土,又称软弱夹层,是指坚硬岩层之间所夹的力学强度低、泥炭质含量高、遇水易软化、厚度较薄、延伸较远的软弱岩层。这种软弱夹层在岩体结构面中性质较差,对岩体变形和稳定件影响较大。软弱夹层的形成需要一定的物质条件和力学作用基础,通常由泥岩和粉砂岩软硬相间形成的沉积岩层结构,经过水、温度等外界因素的长期促进作用而形成。
关键词:软土,夹层,甬台温铁路,软土地基,夹层软土
资源监控发展现状
资源监控发展现状
该文设计出一种基于Client/Server分布式体系结构的局域网主机资源监控系统。文章首先介绍了系统各组成部分及功能,然后对系统实现过程中的关键技术进行阐述。实验证明,该系统的设计能有效的对局域网内各主机进行监控和管理,从而有效保护网内主机信息资源的安全性。
关键词:保护网,资源监控,体系结构,分布式
维修现状技术发展前景?
维修现状技术发展前景?
随着我国经济的不断发展,数控机床成为工业和制造业生产中不可缺少的设备,能够提高生产效率和精度,因数控机床是高精密设备,在使用中难免会发生故障,我国在维修数控机床方面较西方国家有很大差距,
关键词:提高生产效率,高精密,生产效率,维修现状
城乡经济互动产学研合作资源
城乡经济互动产学研合作资源
城乡经济互动是指在经济和社会发展的过程中,通过积极促进城乡人力、市场、信息、产业和文化等各种要素的流通,形成城乡之间全方位的沟通、联系、交流与互促机制。这种互动旨在在城乡购买力全面提高的基础上,逐步实现二者发展的动态平衡过程。城乡经济互动模式不是人的主观意识的产物,而是随着社会经济不断向前发展的必然结果,是社会经济发展到一定阶段的必然要求。
关键词:互动城乡经济,城乡经济互动,互动有利于,城乡经济,一体化
STL焦炉鼓风机三电一体化(EIC)的用途
STL焦炉鼓风机三电一体化(EIC)的用途
STL焦炉鼓风机三电一体化主要涉及到焦炉鼓风机的电气、仪表和控制三个方面的整合。这种整合旨在提高焦炉鼓风机的运行效率、安全性和可靠性,以满足焦炉生产的需求。
关键词:横河,STL,详细介绍,一体化,EIC,STL焦炉鼓风机
信息窃取技术哪里有?
信息窃取技术哪里有?
信息窃取是一种非法行为,通常涉及获取他人的个人信息、财务信息、密码等敏感数据,以用于欺诈或其他非法目的。这种行为不仅违反了个人隐私和数据保护的原则,也可能导致严重的后果,包括身份盗用、财务损失和法律追究。因此,我们应该高度重视信息安全和隐私保护,避免任何可能的信息窃取行为。这包括加强个人信息的保护、使用安全的网络和服务、定期更新软件和操作系统等措施。如果发现任何可疑的活动或受到信息窃取的威胁,应立即向相关机构报告并寻求帮助。
关键词:信息互动,网络社会,信息窃取
重组促胰岛素分泌素技术哪里有?
重组促胰岛素分泌素技术哪里有?
重组促胰岛素分泌素是一种通过基因重组技术生产的药物,旨在模拟人体生理性的胰高血糖素浓度,刺激胰腺β细胞释放胰岛素。它在糖尿病治疗中起着重要作用,主要用于控制血糖水平。在正常情况下,胰岛素是由胰腺中的胰岛β细胞合成并分泌的一种蛋白质激素。然而,当患有糖尿病时,胰岛素分泌功能可能存在缺陷,无法对血糖进行有效调节。因此,使用重组促胰岛素分泌素可以帮助刺激胰腺β细胞释放胰岛素,进而控制血糖水平。
关键词:统计学,胰岛素,生物活性,显著性,标定,重组促胰岛素分泌素
高低报警的用途
高低报警的用途
高低报警在多种领域中都有应用,特别是在涉及安全监测和警报系统的场合。在硫化氢监测仪中,高低报警值是指设定的两个不同的报警阈值,用于监测空气中硫化氢浓度的高和低水平。当硫化氢浓度超过高报警值时,监测仪会发出警报,提醒人们存在危险,这通常用于指示硫化氢浓度超过安全限制的情况,需要立即采取紧急措施。而当硫化氢浓度低于低报警值时,监测仪同样会发出警报,这通常用于指示硫化氢浓度接近安全限制的情况,此时需要采取预防措施。
关键词:RCC-E,变化范围,直流系统,放电曲线,核岛,高低报警
官方社群
常见技术问答

答:项目的成熟度随着时间推移可能发生变化,该项目当前具体的成熟度情况,建议您通过在线客服或者我们的全国客服热线400-649-1633进行咨询了解。

答:项目的合作方式多样,包括但不限于合作开发、专利许可、技术转让、技术入股等,具体合作形式可通过在线客服或者我们的全国客服热线400-649-1633对该项目进行咨询。

答:这是平台独家代理的技术转让项目信息,您可通过在线客服或者我们的全国客服热线400-649-1633进行了解,我们专业的技术经纪团队将会与您沟通相关需求细节后给您答复。

答:专业的技术经纪团队,为你提供技术服务、技术转让、技术开发、技术咨询等专业服务,精准匹配,高效对接,确保你全程无忧。

答:我们有优质的技术投产项目、专利、方案、专家、需求等科技资源,还可提供技术项目合作、高校合作、区域技术要素市场解决方案等一系列全流程科技服务。

答:我们是国内“互联网+技术转移”模式探索与实践的先行者,同时是“国家科技成果转化服务示范基地”、“国家技术转移示范机构”,致力于打造卓越的技术创新服务平台,并持续融合运用新技术、新模式,优化科技创新资源整合与配置,形成了“以技术转移为核心,面向企业、高校、科研院所、技术经纪人、技术转移机构、科技服务机构、行业协会、园区、政府等各类创新主体的服务与合作体系。