找到17项技术成果数据。
找技术 >专利数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的专利数据库的搜索方法,一般是用专利名称或关键词的搜索方法,这些方法有众多不便之处。 一种专利数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”设置到的,会在“数据搜索”中出现该分类名称及其信息;没有设置到的,将不会在“数据搜索”中出现该分类名称及其信息。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
面向用户在线学习的多媒体检索系统
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
面向用户在线学习的多媒体检索系统。 本系统采用多媒体计算技术、机器学习技术、模糊映射技术,开发基于内容的多媒体搜索引擎。采用.Net 平台开发基于B/S架构的数字媒体管理系统。系统架构如图1所示。 系统特点: 1. 多媒体搜索引擎能够根据用户的偏好,具有自我在线学习能力,用户能够与系统进行交互,以改善系统检索的准确率。图1 在线学习的多媒体检索系统Figure 1 Multimedia Retrieval System Based on Online Learning 2. 检索算法先进,在保证查全的前提下,具有检索准确率最大化的控制特性。 3. 检索速度快,需要的存储空间小,适合海量多媒体数据库的管理,对新出现的媒体内容,可以采用增量的方式,加载进数据库中。 系统功能: 本系统是针对多媒体的信息化管理设计的,其主要功能如下: 1. 搜索引擎可以适应各种类型的不同格式的多媒体内容检索需求。 2. 能够根据用户的喜好,进行在线学习,使检索的准确率最大化。 3. 通过关键字、素描、多媒体内容,用户可以查询任意一种多媒体数据。 主要技术指标: (1)检索时间:≤2 秒; (2)检索准确率:≥90%; (3)检索查全率:≥95%;
天眼查基于知识图谱的搜索引擎技术及产品
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
天眼查基于知识图谱的搜索引擎技术及产品成果在基于对行业技术状况进行深入调研的基础上,严格遵循《中华人民共和国数据安全法》、《中华人民共和国网络安全法》的基础上,重点分析公开数据分布广泛,不易整合的因素,找到核心技术难点,制定相应技术方案,解决相关问题。 形成全数据集成平台模块,解决数据收集,主要包括数据集成平台和数据收集平台,自动收集框架集成到本研究系统中,新建各种数据自动收集任务,收集互联网相关数据。 形成数据预处理平台模块对经济领域所涉及的各种文本通用处理操作的集成,主要包括 NLP 预处理和词向量预处理。 形成数据标注平台模块解决数据标注对经济领域自动标注算法实现功能展示。 研发知识抽取平台模块建设生成关系抽取器,结合系统其他功能模块,实现对一个句子文本中实体关系三元组的抽取功能。 实现知识图谱可视化平台将构建的经济领域知识图谱以图形式呈现给用户,方便用户观察,通过知识图谱可视化平台进行可视化呈现。
智能搜索引擎关键技术及产业化
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
搜索引擎是获取互联网信息的最重要入口,拥有自主可控的搜索引擎是国家重大战略需求。在智能移动设备迅速普及、人工智能技术快速发展的时代背景下,用户期望以自然语言表达、直接获取正确答案,基于关键词的传统搜索引擎已不能满足便捷、高效、精准地获取信息的需求。面对复杂多样的自然语言查询和浩如烟海的互联网数据,深刻理解需求、精准给出答案成为搜索领域世界公认难题。创新地融合知识图谱及深度学习技术,研发深刻理解意图、精准呈现结果、自然便捷交互的智能搜索引擎,是解决公认难题的必由之路。正是搜索引擎的智能化,造就了百度中文搜索引擎与时俱进,继续成为亿万网民获取信息的最主要入口。该项目在大规模知识图谱、基于深度语义分析的需求理解、基于深度学习的搜索排序、语音交互等方面取得重大突破,研发了自主可控的智能搜索引擎,占据了该领域的技术制高点。核心创新点如下:提出了大规模中文知识图谱构建及计算技术。突破了传统知识获取规模小、成本高、效率低的瓶颈。构建了全球最大的中文知识图谱,在知识图谱规模、图谱数据容量及检索性能等指标上达到国际领先水平。提出了基于知识图谱和深度语义分析的需求理解模型,实现对用户直接意图的精准识别、动态预测以及潜在意图的提前发现和主动推荐。意图识别准确率达95%,动态预测提升搜索效率10倍,并为85%的查询主动推荐相关结果。提出了基于深度学习的搜索排序算法,结合深度问答技术,突破了语义相关性弱、搜索结果不直观的瓶颈。在国际上首次将深度学习应用于搜索引擎,搜索结果准确率达85%,每日为超过2亿条查询直接提供正确答案。提出了语音、语言、搜索一体优化的语音搜索技术。解决了口语化查询识别和理解准确率低、自然网页难以直接播报的难题。百度深度学习语音识别入选《麻省理工评论》2016年“十大突破技术”。每天响应超过6亿次语音请求,为用户提供了更为便利的体验,并惠及盲人、老人、儿童等群体。上述成果申请发明专利401项,已获授权205项,其中国际授权发明专利12项,在ACL、SIGIR、AAAI等领域顶级会议发表论文103篇。成果被院士专家鉴定为在中文搜索领域及知识图谱规模、图谱数据容量及检索性能、中文智能问答覆盖率及准确率等多项指标上“达到国际领先水平”。百度智能搜索产品,拥有6亿多用户,日均响应搜索约60亿次。多次获得习近平总书记、李克强总理等国家领导人称赞,全国人大常委会原副委员长、中国科学院原院长路甬祥院士在视察智能搜索成果时称赞百度是“新时代的民族英雄”。从2015年1月到2017年6月,取得直接经济效益170.56亿元,通过服务百度集团实现间接经济效益1062.06亿元。项目成果还服务了超过100万家企事业单位,带动相关产业经济效益5.3万亿元。成果曾分别获2013年和2017年中国电子学会科学技术奖一等奖。
移动美食搜索引擎系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
课题来源与背景:搜索美食引擎必须有用户行为分析功能,能够记录用户的搜索历史,进而得出用户的喜好模型,给用户提供更加贴近需求的搜索结果。人们通常只是通过少量关键词与检索系统进行沟通,检索系统往往不能比较准确地返回用户所真正需求的信息。因此,进行搜索美食引擎的用户行为分析是非常必要的。研究目的与意义:当前互联网搜索的主要盈利模式是“竞价排名”能够对搜索结果进行适配,更好的在用户的手机上展示。适配包括文字长短裁减,媒体格式适配等。和“广告位购买”,手机搜索是从互联网模式发展起来的,因此不妨借鉴互联网搜索的盈利模式。主要论点与论据移动搜索是一个很有发展前景的业务,国内外移引擎公司合作。搜索美食引擎公司也有从互联网搜索扩展到移动搜索的强劲动力。创见与创新:内容具有成本,这些信息必须经过收集整理,并时常更新。运营商不可能免费获得这些信息,很可能要从专业的机构或者cP/SP购买,要付出一定的成本。因此对于本地信息,出于成本的考虑,运营商有收费的需求;而由于可以给出精确的搜索结果,本地搜索也有收费的可能。另外,搜索美食引擎必须支持自然语句搜索并对搜索请求进行语义分析,给出更加符合用户要求的结果。展现适配不同的手机性能和功能是一样的,搜索美食引擎应该具有适配性。社会经济效益,存在的问题:移动搜索业务之所以受到越来越多的关注,一方竞价排名是搜索美食引擎关键词广告的一种形式,按照付费最高者排名靠前的原则,对购买了同一关键词的网站进行排名的一种方式。竞价排名一般采取按点击收费的方式。竞价排名是搜索美食引擎公司的主要收益来源。广告位购买是在搜索美食引擎的主页和返回搜索结果页面的固定位置,设置广告位,由广告主来购买。对广告主客户来讲,手机搜索的广告比互联网搜索的广告更具吸引力。众所周知,手机广告因其具有传统媒介无可比拟的优势,即分众,定向,及时,互动,传播而成为最受广告界关注的“第五媒体”。手机媒体的互动性使广告信息传递的速度和广告质量有更大提高,新技术应用有助于用户行为的记录和评估,用户数据库的数据更为精确,定向和定位技术的普及使得能对广告受众进行细致而准确的分类,即提高目标受众覆盖率,也降低成本。经过顾客的许可,广告商可以收集非常有价值的用户信息以及行为信息作为市场营销目的,手机广告已经从简单的SMS广告发展到比较复杂的多媒体广告。而手机广告一旦和手机搜索结合,就会产生更大的效益。因为手机搜过的广告更具针对性,广告的效率更高。首先当用户使用手机搜索某个关键词,一定是他的需求非常急迫,否则可能会借助互联网工具搜索;其次由于手机搜索不能象互联网搜索那样给用户推送海量的搜索结果,因此借助手机搜索推出的广告面是它给普通用户带来了方便,另一方面是因为它潜在的盈利可能。
图书数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的图书数据库的搜索方法,一般是用书名或关键词的搜索方法,这些方法有众多不便之处。 一种图书数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”没有设置到的,将不会在“数据搜索”中出现该分类名称,方便、明显地展示已经发布的信息分类。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。数据库的类型分类,按照“图书分类法”、“出版社”,单独或两者结合起来,这样即可搜索出图书的“图书名、作者、图书简介、联系方式”等。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
体育产业专业智能搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
体育专业搜索引擎与因特网上普通的搜索引擎相比,特点和作用有两个:第一,它是智能化的,对于体育领域信息搜索的效率和相关性大大提高,特别是针对体育科研的搜索效率会大大提高;它能够按照用户的偏好,跟踪、和定位并定期搜集前沿体育科研文献和信息;第二,它是专业化的,面向体育的生产、服务单位的信息服务企业可以购买该搜索引擎进行体育信息服务。使用该搜索引擎的机构可以通过为体育设施、设备生产商和体育场馆开放服务发布信息而赢利,而该搜索引擎的开发商可以通过销售该搜索引擎软件而盈利并扩大影响。应用说明:体育专业因特网智能搜索引擎在现存的搜索引擎系统增加基于知识表示的语义网络--知识库,通过系统与用户交互(人机交互),对用户最初输入的查询词进行精确定义,并给出基于知识的相关语义的词汇作为搜索输入词精确定义后的补充,从而使搜索在精确定义的基础上,按照知识的内容关联(基于知识相关性的语义网)进行全面搜索,并将搜索后的阶段性结果与知识库相对照进行筛选,最终给出以知识特征识别的搜索结果。系统还将专业的检索方法首次应用于搜索引擎,将搜索领域扩入到文本检索以外,进行文献目录检索,包括专利、国家标准、图书馆图书的检索,在用户选定文献目录种类后,经由搜索引擎的知识库判别,再由搜索引擎直接完成目录搜索(用户不必经过搜索引擎之后再访问专利、国家标准、图书馆等体育专业文献的检索系统,而由搜索引擎一次完成)。目前,搜索引擎的流程和体系结构设计已经完成。合作方式:面议。
全学科、全行业智能搜索引擎应用系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该系统由三部分组成:1.搜索引擎:它是该应用系统的核心部分。它有“网络信息主题分类体系”标准(待批国家标准)作为网络信息组织的基础和网络信息查询的大型词表库的支撑,可从16种信息类型、135个行业、8种信息载体快速实现信息三维定位查询;支持目录式搜索和索引式搜索;支持超文本、超媒体搜索方式;同时支持自然语言和受控语言的检索方式;支持同义词联动检索、全文检索、字段检索、组合检索、逐级逼近检索、定题检索服务。2.基于网络环境的中文信息自动标引系统:该系统能对网络爬虫软件从网上自动提取的信息或WEB浏览器输入的批量信息,由计算机自动赋予分类检索标识和主题检索标识,在统一标准的基础上完成网络信息的自动分类标引、主题标引和类目词标引。3.全学科、全行业网络信息分类主题词表及其管理系统:通过科技术语的标准化、信息交流的规范化,实现对全行业、全学科(19个门类、135个行业、学科)的知识信息、工程信息、产品信息进行标准化、规范化、有序化组织,从而达到信息准确的加工、通畅的交流和有效的共享。
基于动态贝叶斯模型的网页垃圾检测方法
成熟度:正在研发
技术类型:发明
应用行业:制造业
技术简介
基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。
网络文摘定制搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该网络平台实现基于搜索引擎、互联网、移动通信、存储管理、智能识别等技术开发的一种新型网络空间,适合大、中、小企业和个人互联网用户。 创新的理念是:在为信息搜索者提供专有空间的同时,使用智能搜索引擎,将用户设定的信息需求准确、及时、自动的存放到自有个性空间,为用户提供及时、方便和安全的信息文摘平台。 调查显示,70%以上的用户通过搜索引擎找到相关的内容。据2006年3月CNNIC的调查数据,中国内地的网民数量达到1.2亿,由此可以看出,搜索引擎已经成为一个实实在在的信息枢纽和信息门户,成为用户获取网络信息的首选工具。 经过10年的市场培养,搜索引擎营销在中国已经收到了普遍的认可。计世资讯(CCW Research)最新的研究报告预计,2006年中国的搜索引擎市场总额将突破20亿元大关,并实现46%左右的增长。计世资讯(CCW Research)认为,中国互联网市场上存在的搜索引擎企业形成了三层梯队:第一层梯队是Google、百度、Yahoo;第二层梯队是中搜、新浪、搜狐、网易;第三层梯队是正在兴起的专业搜索。搜索引擎从一个默默无闻的网络工具在10多年内迅速窜升成为互联网上仅次于邮件的第二大应用,并成为今天的投资人最感兴趣的技术之一,其直接诱因是互联网内容的爆炸式增长。 资料显示,1994年7月在卡内基梅隆大学诞生的第一个真正意义的互联网搜索引擎Lycos,其最初收录索引的只有5.4万个网页,到今天全球影响力最大的搜索引擎Google收录索引已超过80亿个网页,运行搜索引擎从最初的单台服务器到数以几十万计的服务器,依然跟不上互联网信息资源的增长速度,而且毫无疑问,今天的内容正在以前所未有的速度递增,这给我们进行内容的收集和整理带来了很大挑战。 搜索引擎的价值在于将传统的静态环境下的信息检索技术转移到动态、实时的网络环境中,并应用到互联网、外联网和企业内网的信息资源管理和信息利用中去,通过搜索引擎感知企业外部经营环境,进行信息资源开发、管理和利用,进而塑造企业竞争优势。今天,全球化和网络化对企业信息和知识资产的加工共享已经不只局限在提高生产率、有效整合企业资源、降低运营成本这些短期收益方面,更重要的是它已经涉及到企业的核心竞争力、生存力和综合实力的长远问题,已成为流淌在企业生产经营活动中的一种血液,成为另一种无形的生产要素。 在搜索引擎的发展方向上,一方面是追求质量,另一方面是扩展应用。人们对质量的追求总是无穷无尽的,新的搜索引擎技术将会“更准”—更加智能化、结果更让人满意;“更全”—数据容量更大,找到的信息更全;“更快”—查询速度快,内容更新快;“更大”—数据容量更大。扩展应用的关键在于发掘需求、细分需求,满足人的各个方面的需求,例如各种多媒体的专向搜索、各种专业的垂直搜索都会有广阔的市场。 网络文摘定制搜索引擎及时把人们从繁忙中解脱出来,根据人们的需要,在所关注的网站上搜索信息,减少了网民在网上查找资料消耗的时间,及时把相关信息查找出来,极大的提升效率,经验证明:相关主题在行业网站上出现的几率最大,行业网站基本包括了最新成果的相关信息。网络文摘定制搜索引擎作为专业化、个性化的搜索引擎服务将得到极为快速的发展,培育并影响着个人用户进行信息消费的习惯。 它以用户为中心实现了搜索引擎服务从网络信息导航向网络信息服务转变,形成新型信息增值服务的巨大市场空间。 新一轮的搜索技术竞争将在智能化和个性化领域展开,网络文摘定制搜索引擎将会有一个美好的未来。
找到17项技术成果数据。
找技术 >专利数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的专利数据库的搜索方法,一般是用专利名称或关键词的搜索方法,这些方法有众多不便之处。 一种专利数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”设置到的,会在“数据搜索”中出现该分类名称及其信息;没有设置到的,将不会在“数据搜索”中出现该分类名称及其信息。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
面向用户在线学习的多媒体检索系统
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
面向用户在线学习的多媒体检索系统。 本系统采用多媒体计算技术、机器学习技术、模糊映射技术,开发基于内容的多媒体搜索引擎。采用.Net 平台开发基于B/S架构的数字媒体管理系统。系统架构如图1所示。 系统特点: 1. 多媒体搜索引擎能够根据用户的偏好,具有自我在线学习能力,用户能够与系统进行交互,以改善系统检索的准确率。图1 在线学习的多媒体检索系统Figure 1 Multimedia Retrieval System Based on Online Learning 2. 检索算法先进,在保证查全的前提下,具有检索准确率最大化的控制特性。 3. 检索速度快,需要的存储空间小,适合海量多媒体数据库的管理,对新出现的媒体内容,可以采用增量的方式,加载进数据库中。 系统功能: 本系统是针对多媒体的信息化管理设计的,其主要功能如下: 1. 搜索引擎可以适应各种类型的不同格式的多媒体内容检索需求。 2. 能够根据用户的喜好,进行在线学习,使检索的准确率最大化。 3. 通过关键字、素描、多媒体内容,用户可以查询任意一种多媒体数据。 主要技术指标: (1)检索时间:≤2 秒; (2)检索准确率:≥90%; (3)检索查全率:≥95%;
天眼查基于知识图谱的搜索引擎技术及产品
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
天眼查基于知识图谱的搜索引擎技术及产品成果在基于对行业技术状况进行深入调研的基础上,严格遵循《中华人民共和国数据安全法》、《中华人民共和国网络安全法》的基础上,重点分析公开数据分布广泛,不易整合的因素,找到核心技术难点,制定相应技术方案,解决相关问题。 形成全数据集成平台模块,解决数据收集,主要包括数据集成平台和数据收集平台,自动收集框架集成到本研究系统中,新建各种数据自动收集任务,收集互联网相关数据。 形成数据预处理平台模块对经济领域所涉及的各种文本通用处理操作的集成,主要包括 NLP 预处理和词向量预处理。 形成数据标注平台模块解决数据标注对经济领域自动标注算法实现功能展示。 研发知识抽取平台模块建设生成关系抽取器,结合系统其他功能模块,实现对一个句子文本中实体关系三元组的抽取功能。 实现知识图谱可视化平台将构建的经济领域知识图谱以图形式呈现给用户,方便用户观察,通过知识图谱可视化平台进行可视化呈现。
智能搜索引擎关键技术及产业化
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
搜索引擎是获取互联网信息的最重要入口,拥有自主可控的搜索引擎是国家重大战略需求。在智能移动设备迅速普及、人工智能技术快速发展的时代背景下,用户期望以自然语言表达、直接获取正确答案,基于关键词的传统搜索引擎已不能满足便捷、高效、精准地获取信息的需求。面对复杂多样的自然语言查询和浩如烟海的互联网数据,深刻理解需求、精准给出答案成为搜索领域世界公认难题。创新地融合知识图谱及深度学习技术,研发深刻理解意图、精准呈现结果、自然便捷交互的智能搜索引擎,是解决公认难题的必由之路。正是搜索引擎的智能化,造就了百度中文搜索引擎与时俱进,继续成为亿万网民获取信息的最主要入口。该项目在大规模知识图谱、基于深度语义分析的需求理解、基于深度学习的搜索排序、语音交互等方面取得重大突破,研发了自主可控的智能搜索引擎,占据了该领域的技术制高点。核心创新点如下:提出了大规模中文知识图谱构建及计算技术。突破了传统知识获取规模小、成本高、效率低的瓶颈。构建了全球最大的中文知识图谱,在知识图谱规模、图谱数据容量及检索性能等指标上达到国际领先水平。提出了基于知识图谱和深度语义分析的需求理解模型,实现对用户直接意图的精准识别、动态预测以及潜在意图的提前发现和主动推荐。意图识别准确率达95%,动态预测提升搜索效率10倍,并为85%的查询主动推荐相关结果。提出了基于深度学习的搜索排序算法,结合深度问答技术,突破了语义相关性弱、搜索结果不直观的瓶颈。在国际上首次将深度学习应用于搜索引擎,搜索结果准确率达85%,每日为超过2亿条查询直接提供正确答案。提出了语音、语言、搜索一体优化的语音搜索技术。解决了口语化查询识别和理解准确率低、自然网页难以直接播报的难题。百度深度学习语音识别入选《麻省理工评论》2016年“十大突破技术”。每天响应超过6亿次语音请求,为用户提供了更为便利的体验,并惠及盲人、老人、儿童等群体。上述成果申请发明专利401项,已获授权205项,其中国际授权发明专利12项,在ACL、SIGIR、AAAI等领域顶级会议发表论文103篇。成果被院士专家鉴定为在中文搜索领域及知识图谱规模、图谱数据容量及检索性能、中文智能问答覆盖率及准确率等多项指标上“达到国际领先水平”。百度智能搜索产品,拥有6亿多用户,日均响应搜索约60亿次。多次获得习近平总书记、李克强总理等国家领导人称赞,全国人大常委会原副委员长、中国科学院原院长路甬祥院士在视察智能搜索成果时称赞百度是“新时代的民族英雄”。从2015年1月到2017年6月,取得直接经济效益170.56亿元,通过服务百度集团实现间接经济效益1062.06亿元。项目成果还服务了超过100万家企事业单位,带动相关产业经济效益5.3万亿元。成果曾分别获2013年和2017年中国电子学会科学技术奖一等奖。
移动美食搜索引擎系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
课题来源与背景:搜索美食引擎必须有用户行为分析功能,能够记录用户的搜索历史,进而得出用户的喜好模型,给用户提供更加贴近需求的搜索结果。人们通常只是通过少量关键词与检索系统进行沟通,检索系统往往不能比较准确地返回用户所真正需求的信息。因此,进行搜索美食引擎的用户行为分析是非常必要的。研究目的与意义:当前互联网搜索的主要盈利模式是“竞价排名”能够对搜索结果进行适配,更好的在用户的手机上展示。适配包括文字长短裁减,媒体格式适配等。和“广告位购买”,手机搜索是从互联网模式发展起来的,因此不妨借鉴互联网搜索的盈利模式。主要论点与论据移动搜索是一个很有发展前景的业务,国内外移引擎公司合作。搜索美食引擎公司也有从互联网搜索扩展到移动搜索的强劲动力。创见与创新:内容具有成本,这些信息必须经过收集整理,并时常更新。运营商不可能免费获得这些信息,很可能要从专业的机构或者cP/SP购买,要付出一定的成本。因此对于本地信息,出于成本的考虑,运营商有收费的需求;而由于可以给出精确的搜索结果,本地搜索也有收费的可能。另外,搜索美食引擎必须支持自然语句搜索并对搜索请求进行语义分析,给出更加符合用户要求的结果。展现适配不同的手机性能和功能是一样的,搜索美食引擎应该具有适配性。社会经济效益,存在的问题:移动搜索业务之所以受到越来越多的关注,一方竞价排名是搜索美食引擎关键词广告的一种形式,按照付费最高者排名靠前的原则,对购买了同一关键词的网站进行排名的一种方式。竞价排名一般采取按点击收费的方式。竞价排名是搜索美食引擎公司的主要收益来源。广告位购买是在搜索美食引擎的主页和返回搜索结果页面的固定位置,设置广告位,由广告主来购买。对广告主客户来讲,手机搜索的广告比互联网搜索的广告更具吸引力。众所周知,手机广告因其具有传统媒介无可比拟的优势,即分众,定向,及时,互动,传播而成为最受广告界关注的“第五媒体”。手机媒体的互动性使广告信息传递的速度和广告质量有更大提高,新技术应用有助于用户行为的记录和评估,用户数据库的数据更为精确,定向和定位技术的普及使得能对广告受众进行细致而准确的分类,即提高目标受众覆盖率,也降低成本。经过顾客的许可,广告商可以收集非常有价值的用户信息以及行为信息作为市场营销目的,手机广告已经从简单的SMS广告发展到比较复杂的多媒体广告。而手机广告一旦和手机搜索结合,就会产生更大的效益。因为手机搜过的广告更具针对性,广告的效率更高。首先当用户使用手机搜索某个关键词,一定是他的需求非常急迫,否则可能会借助互联网工具搜索;其次由于手机搜索不能象互联网搜索那样给用户推送海量的搜索结果,因此借助手机搜索推出的广告面是它给普通用户带来了方便,另一方面是因为它潜在的盈利可能。
图书数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的图书数据库的搜索方法,一般是用书名或关键词的搜索方法,这些方法有众多不便之处。 一种图书数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”没有设置到的,将不会在“数据搜索”中出现该分类名称,方便、明显地展示已经发布的信息分类。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。数据库的类型分类,按照“图书分类法”、“出版社”,单独或两者结合起来,这样即可搜索出图书的“图书名、作者、图书简介、联系方式”等。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
体育产业专业智能搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
体育专业搜索引擎与因特网上普通的搜索引擎相比,特点和作用有两个:第一,它是智能化的,对于体育领域信息搜索的效率和相关性大大提高,特别是针对体育科研的搜索效率会大大提高;它能够按照用户的偏好,跟踪、和定位并定期搜集前沿体育科研文献和信息;第二,它是专业化的,面向体育的生产、服务单位的信息服务企业可以购买该搜索引擎进行体育信息服务。使用该搜索引擎的机构可以通过为体育设施、设备生产商和体育场馆开放服务发布信息而赢利,而该搜索引擎的开发商可以通过销售该搜索引擎软件而盈利并扩大影响。应用说明:体育专业因特网智能搜索引擎在现存的搜索引擎系统增加基于知识表示的语义网络--知识库,通过系统与用户交互(人机交互),对用户最初输入的查询词进行精确定义,并给出基于知识的相关语义的词汇作为搜索输入词精确定义后的补充,从而使搜索在精确定义的基础上,按照知识的内容关联(基于知识相关性的语义网)进行全面搜索,并将搜索后的阶段性结果与知识库相对照进行筛选,最终给出以知识特征识别的搜索结果。系统还将专业的检索方法首次应用于搜索引擎,将搜索领域扩入到文本检索以外,进行文献目录检索,包括专利、国家标准、图书馆图书的检索,在用户选定文献目录种类后,经由搜索引擎的知识库判别,再由搜索引擎直接完成目录搜索(用户不必经过搜索引擎之后再访问专利、国家标准、图书馆等体育专业文献的检索系统,而由搜索引擎一次完成)。目前,搜索引擎的流程和体系结构设计已经完成。合作方式:面议。
全学科、全行业智能搜索引擎应用系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该系统由三部分组成:1.搜索引擎:它是该应用系统的核心部分。它有“网络信息主题分类体系”标准(待批国家标准)作为网络信息组织的基础和网络信息查询的大型词表库的支撑,可从16种信息类型、135个行业、8种信息载体快速实现信息三维定位查询;支持目录式搜索和索引式搜索;支持超文本、超媒体搜索方式;同时支持自然语言和受控语言的检索方式;支持同义词联动检索、全文检索、字段检索、组合检索、逐级逼近检索、定题检索服务。2.基于网络环境的中文信息自动标引系统:该系统能对网络爬虫软件从网上自动提取的信息或WEB浏览器输入的批量信息,由计算机自动赋予分类检索标识和主题检索标识,在统一标准的基础上完成网络信息的自动分类标引、主题标引和类目词标引。3.全学科、全行业网络信息分类主题词表及其管理系统:通过科技术语的标准化、信息交流的规范化,实现对全行业、全学科(19个门类、135个行业、学科)的知识信息、工程信息、产品信息进行标准化、规范化、有序化组织,从而达到信息准确的加工、通畅的交流和有效的共享。
基于动态贝叶斯模型的网页垃圾检测方法
成熟度:正在研发
技术类型:发明
应用行业:制造业
技术简介
基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。
网络文摘定制搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该网络平台实现基于搜索引擎、互联网、移动通信、存储管理、智能识别等技术开发的一种新型网络空间,适合大、中、小企业和个人互联网用户。 创新的理念是:在为信息搜索者提供专有空间的同时,使用智能搜索引擎,将用户设定的信息需求准确、及时、自动的存放到自有个性空间,为用户提供及时、方便和安全的信息文摘平台。 调查显示,70%以上的用户通过搜索引擎找到相关的内容。据2006年3月CNNIC的调查数据,中国内地的网民数量达到1.2亿,由此可以看出,搜索引擎已经成为一个实实在在的信息枢纽和信息门户,成为用户获取网络信息的首选工具。 经过10年的市场培养,搜索引擎营销在中国已经收到了普遍的认可。计世资讯(CCW Research)最新的研究报告预计,2006年中国的搜索引擎市场总额将突破20亿元大关,并实现46%左右的增长。计世资讯(CCW Research)认为,中国互联网市场上存在的搜索引擎企业形成了三层梯队:第一层梯队是Google、百度、Yahoo;第二层梯队是中搜、新浪、搜狐、网易;第三层梯队是正在兴起的专业搜索。搜索引擎从一个默默无闻的网络工具在10多年内迅速窜升成为互联网上仅次于邮件的第二大应用,并成为今天的投资人最感兴趣的技术之一,其直接诱因是互联网内容的爆炸式增长。 资料显示,1994年7月在卡内基梅隆大学诞生的第一个真正意义的互联网搜索引擎Lycos,其最初收录索引的只有5.4万个网页,到今天全球影响力最大的搜索引擎Google收录索引已超过80亿个网页,运行搜索引擎从最初的单台服务器到数以几十万计的服务器,依然跟不上互联网信息资源的增长速度,而且毫无疑问,今天的内容正在以前所未有的速度递增,这给我们进行内容的收集和整理带来了很大挑战。 搜索引擎的价值在于将传统的静态环境下的信息检索技术转移到动态、实时的网络环境中,并应用到互联网、外联网和企业内网的信息资源管理和信息利用中去,通过搜索引擎感知企业外部经营环境,进行信息资源开发、管理和利用,进而塑造企业竞争优势。今天,全球化和网络化对企业信息和知识资产的加工共享已经不只局限在提高生产率、有效整合企业资源、降低运营成本这些短期收益方面,更重要的是它已经涉及到企业的核心竞争力、生存力和综合实力的长远问题,已成为流淌在企业生产经营活动中的一种血液,成为另一种无形的生产要素。 在搜索引擎的发展方向上,一方面是追求质量,另一方面是扩展应用。人们对质量的追求总是无穷无尽的,新的搜索引擎技术将会“更准”—更加智能化、结果更让人满意;“更全”—数据容量更大,找到的信息更全;“更快”—查询速度快,内容更新快;“更大”—数据容量更大。扩展应用的关键在于发掘需求、细分需求,满足人的各个方面的需求,例如各种多媒体的专向搜索、各种专业的垂直搜索都会有广阔的市场。 网络文摘定制搜索引擎及时把人们从繁忙中解脱出来,根据人们的需要,在所关注的网站上搜索信息,减少了网民在网上查找资料消耗的时间,及时把相关信息查找出来,极大的提升效率,经验证明:相关主题在行业网站上出现的几率最大,行业网站基本包括了最新成果的相关信息。网络文摘定制搜索引擎作为专业化、个性化的搜索引擎服务将得到极为快速的发展,培育并影响着个人用户进行信息消费的习惯。 它以用户为中心实现了搜索引擎服务从网络信息导航向网络信息服务转变,形成新型信息增值服务的巨大市场空间。 新一轮的搜索技术竞争将在智能化和个性化领域展开,网络文摘定制搜索引擎将会有一个美好的未来。
找到17项技术成果数据。
找技术 >专利数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的专利数据库的搜索方法,一般是用专利名称或关键词的搜索方法,这些方法有众多不便之处。 一种专利数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”设置到的,会在“数据搜索”中出现该分类名称及其信息;没有设置到的,将不会在“数据搜索”中出现该分类名称及其信息。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
面向用户在线学习的多媒体检索系统
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
面向用户在线学习的多媒体检索系统。 本系统采用多媒体计算技术、机器学习技术、模糊映射技术,开发基于内容的多媒体搜索引擎。采用.Net 平台开发基于B/S架构的数字媒体管理系统。系统架构如图1所示。 系统特点: 1. 多媒体搜索引擎能够根据用户的偏好,具有自我在线学习能力,用户能够与系统进行交互,以改善系统检索的准确率。图1 在线学习的多媒体检索系统Figure 1 Multimedia Retrieval System Based on Online Learning 2. 检索算法先进,在保证查全的前提下,具有检索准确率最大化的控制特性。 3. 检索速度快,需要的存储空间小,适合海量多媒体数据库的管理,对新出现的媒体内容,可以采用增量的方式,加载进数据库中。 系统功能: 本系统是针对多媒体的信息化管理设计的,其主要功能如下: 1. 搜索引擎可以适应各种类型的不同格式的多媒体内容检索需求。 2. 能够根据用户的喜好,进行在线学习,使检索的准确率最大化。 3. 通过关键字、素描、多媒体内容,用户可以查询任意一种多媒体数据。 主要技术指标: (1)检索时间:≤2 秒; (2)检索准确率:≥90%; (3)检索查全率:≥95%;
天眼查基于知识图谱的搜索引擎技术及产品
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
天眼查基于知识图谱的搜索引擎技术及产品成果在基于对行业技术状况进行深入调研的基础上,严格遵循《中华人民共和国数据安全法》、《中华人民共和国网络安全法》的基础上,重点分析公开数据分布广泛,不易整合的因素,找到核心技术难点,制定相应技术方案,解决相关问题。 形成全数据集成平台模块,解决数据收集,主要包括数据集成平台和数据收集平台,自动收集框架集成到本研究系统中,新建各种数据自动收集任务,收集互联网相关数据。 形成数据预处理平台模块对经济领域所涉及的各种文本通用处理操作的集成,主要包括 NLP 预处理和词向量预处理。 形成数据标注平台模块解决数据标注对经济领域自动标注算法实现功能展示。 研发知识抽取平台模块建设生成关系抽取器,结合系统其他功能模块,实现对一个句子文本中实体关系三元组的抽取功能。 实现知识图谱可视化平台将构建的经济领域知识图谱以图形式呈现给用户,方便用户观察,通过知识图谱可视化平台进行可视化呈现。
智能搜索引擎关键技术及产业化
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
搜索引擎是获取互联网信息的最重要入口,拥有自主可控的搜索引擎是国家重大战略需求。在智能移动设备迅速普及、人工智能技术快速发展的时代背景下,用户期望以自然语言表达、直接获取正确答案,基于关键词的传统搜索引擎已不能满足便捷、高效、精准地获取信息的需求。面对复杂多样的自然语言查询和浩如烟海的互联网数据,深刻理解需求、精准给出答案成为搜索领域世界公认难题。创新地融合知识图谱及深度学习技术,研发深刻理解意图、精准呈现结果、自然便捷交互的智能搜索引擎,是解决公认难题的必由之路。正是搜索引擎的智能化,造就了百度中文搜索引擎与时俱进,继续成为亿万网民获取信息的最主要入口。该项目在大规模知识图谱、基于深度语义分析的需求理解、基于深度学习的搜索排序、语音交互等方面取得重大突破,研发了自主可控的智能搜索引擎,占据了该领域的技术制高点。核心创新点如下:提出了大规模中文知识图谱构建及计算技术。突破了传统知识获取规模小、成本高、效率低的瓶颈。构建了全球最大的中文知识图谱,在知识图谱规模、图谱数据容量及检索性能等指标上达到国际领先水平。提出了基于知识图谱和深度语义分析的需求理解模型,实现对用户直接意图的精准识别、动态预测以及潜在意图的提前发现和主动推荐。意图识别准确率达95%,动态预测提升搜索效率10倍,并为85%的查询主动推荐相关结果。提出了基于深度学习的搜索排序算法,结合深度问答技术,突破了语义相关性弱、搜索结果不直观的瓶颈。在国际上首次将深度学习应用于搜索引擎,搜索结果准确率达85%,每日为超过2亿条查询直接提供正确答案。提出了语音、语言、搜索一体优化的语音搜索技术。解决了口语化查询识别和理解准确率低、自然网页难以直接播报的难题。百度深度学习语音识别入选《麻省理工评论》2016年“十大突破技术”。每天响应超过6亿次语音请求,为用户提供了更为便利的体验,并惠及盲人、老人、儿童等群体。上述成果申请发明专利401项,已获授权205项,其中国际授权发明专利12项,在ACL、SIGIR、AAAI等领域顶级会议发表论文103篇。成果被院士专家鉴定为在中文搜索领域及知识图谱规模、图谱数据容量及检索性能、中文智能问答覆盖率及准确率等多项指标上“达到国际领先水平”。百度智能搜索产品,拥有6亿多用户,日均响应搜索约60亿次。多次获得习近平总书记、李克强总理等国家领导人称赞,全国人大常委会原副委员长、中国科学院原院长路甬祥院士在视察智能搜索成果时称赞百度是“新时代的民族英雄”。从2015年1月到2017年6月,取得直接经济效益170.56亿元,通过服务百度集团实现间接经济效益1062.06亿元。项目成果还服务了超过100万家企事业单位,带动相关产业经济效益5.3万亿元。成果曾分别获2013年和2017年中国电子学会科学技术奖一等奖。
移动美食搜索引擎系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
课题来源与背景:搜索美食引擎必须有用户行为分析功能,能够记录用户的搜索历史,进而得出用户的喜好模型,给用户提供更加贴近需求的搜索结果。人们通常只是通过少量关键词与检索系统进行沟通,检索系统往往不能比较准确地返回用户所真正需求的信息。因此,进行搜索美食引擎的用户行为分析是非常必要的。研究目的与意义:当前互联网搜索的主要盈利模式是“竞价排名”能够对搜索结果进行适配,更好的在用户的手机上展示。适配包括文字长短裁减,媒体格式适配等。和“广告位购买”,手机搜索是从互联网模式发展起来的,因此不妨借鉴互联网搜索的盈利模式。主要论点与论据移动搜索是一个很有发展前景的业务,国内外移引擎公司合作。搜索美食引擎公司也有从互联网搜索扩展到移动搜索的强劲动力。创见与创新:内容具有成本,这些信息必须经过收集整理,并时常更新。运营商不可能免费获得这些信息,很可能要从专业的机构或者cP/SP购买,要付出一定的成本。因此对于本地信息,出于成本的考虑,运营商有收费的需求;而由于可以给出精确的搜索结果,本地搜索也有收费的可能。另外,搜索美食引擎必须支持自然语句搜索并对搜索请求进行语义分析,给出更加符合用户要求的结果。展现适配不同的手机性能和功能是一样的,搜索美食引擎应该具有适配性。社会经济效益,存在的问题:移动搜索业务之所以受到越来越多的关注,一方竞价排名是搜索美食引擎关键词广告的一种形式,按照付费最高者排名靠前的原则,对购买了同一关键词的网站进行排名的一种方式。竞价排名一般采取按点击收费的方式。竞价排名是搜索美食引擎公司的主要收益来源。广告位购买是在搜索美食引擎的主页和返回搜索结果页面的固定位置,设置广告位,由广告主来购买。对广告主客户来讲,手机搜索的广告比互联网搜索的广告更具吸引力。众所周知,手机广告因其具有传统媒介无可比拟的优势,即分众,定向,及时,互动,传播而成为最受广告界关注的“第五媒体”。手机媒体的互动性使广告信息传递的速度和广告质量有更大提高,新技术应用有助于用户行为的记录和评估,用户数据库的数据更为精确,定向和定位技术的普及使得能对广告受众进行细致而准确的分类,即提高目标受众覆盖率,也降低成本。经过顾客的许可,广告商可以收集非常有价值的用户信息以及行为信息作为市场营销目的,手机广告已经从简单的SMS广告发展到比较复杂的多媒体广告。而手机广告一旦和手机搜索结合,就会产生更大的效益。因为手机搜过的广告更具针对性,广告的效率更高。首先当用户使用手机搜索某个关键词,一定是他的需求非常急迫,否则可能会借助互联网工具搜索;其次由于手机搜索不能象互联网搜索那样给用户推送海量的搜索结果,因此借助手机搜索推出的广告面是它给普通用户带来了方便,另一方面是因为它潜在的盈利可能。
图书数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的图书数据库的搜索方法,一般是用书名或关键词的搜索方法,这些方法有众多不便之处。 一种图书数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”没有设置到的,将不会在“数据搜索”中出现该分类名称,方便、明显地展示已经发布的信息分类。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。数据库的类型分类,按照“图书分类法”、“出版社”,单独或两者结合起来,这样即可搜索出图书的“图书名、作者、图书简介、联系方式”等。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
体育产业专业智能搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
体育专业搜索引擎与因特网上普通的搜索引擎相比,特点和作用有两个:第一,它是智能化的,对于体育领域信息搜索的效率和相关性大大提高,特别是针对体育科研的搜索效率会大大提高;它能够按照用户的偏好,跟踪、和定位并定期搜集前沿体育科研文献和信息;第二,它是专业化的,面向体育的生产、服务单位的信息服务企业可以购买该搜索引擎进行体育信息服务。使用该搜索引擎的机构可以通过为体育设施、设备生产商和体育场馆开放服务发布信息而赢利,而该搜索引擎的开发商可以通过销售该搜索引擎软件而盈利并扩大影响。应用说明:体育专业因特网智能搜索引擎在现存的搜索引擎系统增加基于知识表示的语义网络--知识库,通过系统与用户交互(人机交互),对用户最初输入的查询词进行精确定义,并给出基于知识的相关语义的词汇作为搜索输入词精确定义后的补充,从而使搜索在精确定义的基础上,按照知识的内容关联(基于知识相关性的语义网)进行全面搜索,并将搜索后的阶段性结果与知识库相对照进行筛选,最终给出以知识特征识别的搜索结果。系统还将专业的检索方法首次应用于搜索引擎,将搜索领域扩入到文本检索以外,进行文献目录检索,包括专利、国家标准、图书馆图书的检索,在用户选定文献目录种类后,经由搜索引擎的知识库判别,再由搜索引擎直接完成目录搜索(用户不必经过搜索引擎之后再访问专利、国家标准、图书馆等体育专业文献的检索系统,而由搜索引擎一次完成)。目前,搜索引擎的流程和体系结构设计已经完成。合作方式:面议。
全学科、全行业智能搜索引擎应用系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该系统由三部分组成:1.搜索引擎:它是该应用系统的核心部分。它有“网络信息主题分类体系”标准(待批国家标准)作为网络信息组织的基础和网络信息查询的大型词表库的支撑,可从16种信息类型、135个行业、8种信息载体快速实现信息三维定位查询;支持目录式搜索和索引式搜索;支持超文本、超媒体搜索方式;同时支持自然语言和受控语言的检索方式;支持同义词联动检索、全文检索、字段检索、组合检索、逐级逼近检索、定题检索服务。2.基于网络环境的中文信息自动标引系统:该系统能对网络爬虫软件从网上自动提取的信息或WEB浏览器输入的批量信息,由计算机自动赋予分类检索标识和主题检索标识,在统一标准的基础上完成网络信息的自动分类标引、主题标引和类目词标引。3.全学科、全行业网络信息分类主题词表及其管理系统:通过科技术语的标准化、信息交流的规范化,实现对全行业、全学科(19个门类、135个行业、学科)的知识信息、工程信息、产品信息进行标准化、规范化、有序化组织,从而达到信息准确的加工、通畅的交流和有效的共享。
基于动态贝叶斯模型的网页垃圾检测方法
成熟度:正在研发
技术类型:发明
应用行业:制造业
技术简介
基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。
网络文摘定制搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该网络平台实现基于搜索引擎、互联网、移动通信、存储管理、智能识别等技术开发的一种新型网络空间,适合大、中、小企业和个人互联网用户。 创新的理念是:在为信息搜索者提供专有空间的同时,使用智能搜索引擎,将用户设定的信息需求准确、及时、自动的存放到自有个性空间,为用户提供及时、方便和安全的信息文摘平台。 调查显示,70%以上的用户通过搜索引擎找到相关的内容。据2006年3月CNNIC的调查数据,中国内地的网民数量达到1.2亿,由此可以看出,搜索引擎已经成为一个实实在在的信息枢纽和信息门户,成为用户获取网络信息的首选工具。 经过10年的市场培养,搜索引擎营销在中国已经收到了普遍的认可。计世资讯(CCW Research)最新的研究报告预计,2006年中国的搜索引擎市场总额将突破20亿元大关,并实现46%左右的增长。计世资讯(CCW Research)认为,中国互联网市场上存在的搜索引擎企业形成了三层梯队:第一层梯队是Google、百度、Yahoo;第二层梯队是中搜、新浪、搜狐、网易;第三层梯队是正在兴起的专业搜索。搜索引擎从一个默默无闻的网络工具在10多年内迅速窜升成为互联网上仅次于邮件的第二大应用,并成为今天的投资人最感兴趣的技术之一,其直接诱因是互联网内容的爆炸式增长。 资料显示,1994年7月在卡内基梅隆大学诞生的第一个真正意义的互联网搜索引擎Lycos,其最初收录索引的只有5.4万个网页,到今天全球影响力最大的搜索引擎Google收录索引已超过80亿个网页,运行搜索引擎从最初的单台服务器到数以几十万计的服务器,依然跟不上互联网信息资源的增长速度,而且毫无疑问,今天的内容正在以前所未有的速度递增,这给我们进行内容的收集和整理带来了很大挑战。 搜索引擎的价值在于将传统的静态环境下的信息检索技术转移到动态、实时的网络环境中,并应用到互联网、外联网和企业内网的信息资源管理和信息利用中去,通过搜索引擎感知企业外部经营环境,进行信息资源开发、管理和利用,进而塑造企业竞争优势。今天,全球化和网络化对企业信息和知识资产的加工共享已经不只局限在提高生产率、有效整合企业资源、降低运营成本这些短期收益方面,更重要的是它已经涉及到企业的核心竞争力、生存力和综合实力的长远问题,已成为流淌在企业生产经营活动中的一种血液,成为另一种无形的生产要素。 在搜索引擎的发展方向上,一方面是追求质量,另一方面是扩展应用。人们对质量的追求总是无穷无尽的,新的搜索引擎技术将会“更准”—更加智能化、结果更让人满意;“更全”—数据容量更大,找到的信息更全;“更快”—查询速度快,内容更新快;“更大”—数据容量更大。扩展应用的关键在于发掘需求、细分需求,满足人的各个方面的需求,例如各种多媒体的专向搜索、各种专业的垂直搜索都会有广阔的市场。 网络文摘定制搜索引擎及时把人们从繁忙中解脱出来,根据人们的需要,在所关注的网站上搜索信息,减少了网民在网上查找资料消耗的时间,及时把相关信息查找出来,极大的提升效率,经验证明:相关主题在行业网站上出现的几率最大,行业网站基本包括了最新成果的相关信息。网络文摘定制搜索引擎作为专业化、个性化的搜索引擎服务将得到极为快速的发展,培育并影响着个人用户进行信息消费的习惯。 它以用户为中心实现了搜索引擎服务从网络信息导航向网络信息服务转变,形成新型信息增值服务的巨大市场空间。 新一轮的搜索技术竞争将在智能化和个性化领域展开,网络文摘定制搜索引擎将会有一个美好的未来。
找到17项技术成果数据。
找技术 >专利数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的专利数据库的搜索方法,一般是用专利名称或关键词的搜索方法,这些方法有众多不便之处。 一种专利数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”设置到的,会在“数据搜索”中出现该分类名称及其信息;没有设置到的,将不会在“数据搜索”中出现该分类名称及其信息。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
面向用户在线学习的多媒体检索系统
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
面向用户在线学习的多媒体检索系统。 本系统采用多媒体计算技术、机器学习技术、模糊映射技术,开发基于内容的多媒体搜索引擎。采用.Net 平台开发基于B/S架构的数字媒体管理系统。系统架构如图1所示。 系统特点: 1. 多媒体搜索引擎能够根据用户的偏好,具有自我在线学习能力,用户能够与系统进行交互,以改善系统检索的准确率。图1 在线学习的多媒体检索系统Figure 1 Multimedia Retrieval System Based on Online Learning 2. 检索算法先进,在保证查全的前提下,具有检索准确率最大化的控制特性。 3. 检索速度快,需要的存储空间小,适合海量多媒体数据库的管理,对新出现的媒体内容,可以采用增量的方式,加载进数据库中。 系统功能: 本系统是针对多媒体的信息化管理设计的,其主要功能如下: 1. 搜索引擎可以适应各种类型的不同格式的多媒体内容检索需求。 2. 能够根据用户的喜好,进行在线学习,使检索的准确率最大化。 3. 通过关键字、素描、多媒体内容,用户可以查询任意一种多媒体数据。 主要技术指标: (1)检索时间:≤2 秒; (2)检索准确率:≥90%; (3)检索查全率:≥95%;
天眼查基于知识图谱的搜索引擎技术及产品
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
天眼查基于知识图谱的搜索引擎技术及产品成果在基于对行业技术状况进行深入调研的基础上,严格遵循《中华人民共和国数据安全法》、《中华人民共和国网络安全法》的基础上,重点分析公开数据分布广泛,不易整合的因素,找到核心技术难点,制定相应技术方案,解决相关问题。 形成全数据集成平台模块,解决数据收集,主要包括数据集成平台和数据收集平台,自动收集框架集成到本研究系统中,新建各种数据自动收集任务,收集互联网相关数据。 形成数据预处理平台模块对经济领域所涉及的各种文本通用处理操作的集成,主要包括 NLP 预处理和词向量预处理。 形成数据标注平台模块解决数据标注对经济领域自动标注算法实现功能展示。 研发知识抽取平台模块建设生成关系抽取器,结合系统其他功能模块,实现对一个句子文本中实体关系三元组的抽取功能。 实现知识图谱可视化平台将构建的经济领域知识图谱以图形式呈现给用户,方便用户观察,通过知识图谱可视化平台进行可视化呈现。
智能搜索引擎关键技术及产业化
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
搜索引擎是获取互联网信息的最重要入口,拥有自主可控的搜索引擎是国家重大战略需求。在智能移动设备迅速普及、人工智能技术快速发展的时代背景下,用户期望以自然语言表达、直接获取正确答案,基于关键词的传统搜索引擎已不能满足便捷、高效、精准地获取信息的需求。面对复杂多样的自然语言查询和浩如烟海的互联网数据,深刻理解需求、精准给出答案成为搜索领域世界公认难题。创新地融合知识图谱及深度学习技术,研发深刻理解意图、精准呈现结果、自然便捷交互的智能搜索引擎,是解决公认难题的必由之路。正是搜索引擎的智能化,造就了百度中文搜索引擎与时俱进,继续成为亿万网民获取信息的最主要入口。该项目在大规模知识图谱、基于深度语义分析的需求理解、基于深度学习的搜索排序、语音交互等方面取得重大突破,研发了自主可控的智能搜索引擎,占据了该领域的技术制高点。核心创新点如下:提出了大规模中文知识图谱构建及计算技术。突破了传统知识获取规模小、成本高、效率低的瓶颈。构建了全球最大的中文知识图谱,在知识图谱规模、图谱数据容量及检索性能等指标上达到国际领先水平。提出了基于知识图谱和深度语义分析的需求理解模型,实现对用户直接意图的精准识别、动态预测以及潜在意图的提前发现和主动推荐。意图识别准确率达95%,动态预测提升搜索效率10倍,并为85%的查询主动推荐相关结果。提出了基于深度学习的搜索排序算法,结合深度问答技术,突破了语义相关性弱、搜索结果不直观的瓶颈。在国际上首次将深度学习应用于搜索引擎,搜索结果准确率达85%,每日为超过2亿条查询直接提供正确答案。提出了语音、语言、搜索一体优化的语音搜索技术。解决了口语化查询识别和理解准确率低、自然网页难以直接播报的难题。百度深度学习语音识别入选《麻省理工评论》2016年“十大突破技术”。每天响应超过6亿次语音请求,为用户提供了更为便利的体验,并惠及盲人、老人、儿童等群体。上述成果申请发明专利401项,已获授权205项,其中国际授权发明专利12项,在ACL、SIGIR、AAAI等领域顶级会议发表论文103篇。成果被院士专家鉴定为在中文搜索领域及知识图谱规模、图谱数据容量及检索性能、中文智能问答覆盖率及准确率等多项指标上“达到国际领先水平”。百度智能搜索产品,拥有6亿多用户,日均响应搜索约60亿次。多次获得习近平总书记、李克强总理等国家领导人称赞,全国人大常委会原副委员长、中国科学院原院长路甬祥院士在视察智能搜索成果时称赞百度是“新时代的民族英雄”。从2015年1月到2017年6月,取得直接经济效益170.56亿元,通过服务百度集团实现间接经济效益1062.06亿元。项目成果还服务了超过100万家企事业单位,带动相关产业经济效益5.3万亿元。成果曾分别获2013年和2017年中国电子学会科学技术奖一等奖。
移动美食搜索引擎系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
课题来源与背景:搜索美食引擎必须有用户行为分析功能,能够记录用户的搜索历史,进而得出用户的喜好模型,给用户提供更加贴近需求的搜索结果。人们通常只是通过少量关键词与检索系统进行沟通,检索系统往往不能比较准确地返回用户所真正需求的信息。因此,进行搜索美食引擎的用户行为分析是非常必要的。研究目的与意义:当前互联网搜索的主要盈利模式是“竞价排名”能够对搜索结果进行适配,更好的在用户的手机上展示。适配包括文字长短裁减,媒体格式适配等。和“广告位购买”,手机搜索是从互联网模式发展起来的,因此不妨借鉴互联网搜索的盈利模式。主要论点与论据移动搜索是一个很有发展前景的业务,国内外移引擎公司合作。搜索美食引擎公司也有从互联网搜索扩展到移动搜索的强劲动力。创见与创新:内容具有成本,这些信息必须经过收集整理,并时常更新。运营商不可能免费获得这些信息,很可能要从专业的机构或者cP/SP购买,要付出一定的成本。因此对于本地信息,出于成本的考虑,运营商有收费的需求;而由于可以给出精确的搜索结果,本地搜索也有收费的可能。另外,搜索美食引擎必须支持自然语句搜索并对搜索请求进行语义分析,给出更加符合用户要求的结果。展现适配不同的手机性能和功能是一样的,搜索美食引擎应该具有适配性。社会经济效益,存在的问题:移动搜索业务之所以受到越来越多的关注,一方竞价排名是搜索美食引擎关键词广告的一种形式,按照付费最高者排名靠前的原则,对购买了同一关键词的网站进行排名的一种方式。竞价排名一般采取按点击收费的方式。竞价排名是搜索美食引擎公司的主要收益来源。广告位购买是在搜索美食引擎的主页和返回搜索结果页面的固定位置,设置广告位,由广告主来购买。对广告主客户来讲,手机搜索的广告比互联网搜索的广告更具吸引力。众所周知,手机广告因其具有传统媒介无可比拟的优势,即分众,定向,及时,互动,传播而成为最受广告界关注的“第五媒体”。手机媒体的互动性使广告信息传递的速度和广告质量有更大提高,新技术应用有助于用户行为的记录和评估,用户数据库的数据更为精确,定向和定位技术的普及使得能对广告受众进行细致而准确的分类,即提高目标受众覆盖率,也降低成本。经过顾客的许可,广告商可以收集非常有价值的用户信息以及行为信息作为市场营销目的,手机广告已经从简单的SMS广告发展到比较复杂的多媒体广告。而手机广告一旦和手机搜索结合,就会产生更大的效益。因为手机搜过的广告更具针对性,广告的效率更高。首先当用户使用手机搜索某个关键词,一定是他的需求非常急迫,否则可能会借助互联网工具搜索;其次由于手机搜索不能象互联网搜索那样给用户推送海量的搜索结果,因此借助手机搜索推出的广告面是它给普通用户带来了方便,另一方面是因为它潜在的盈利可能。
图书数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的图书数据库的搜索方法,一般是用书名或关键词的搜索方法,这些方法有众多不便之处。 一种图书数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”没有设置到的,将不会在“数据搜索”中出现该分类名称,方便、明显地展示已经发布的信息分类。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。数据库的类型分类,按照“图书分类法”、“出版社”,单独或两者结合起来,这样即可搜索出图书的“图书名、作者、图书简介、联系方式”等。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
体育产业专业智能搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
体育专业搜索引擎与因特网上普通的搜索引擎相比,特点和作用有两个:第一,它是智能化的,对于体育领域信息搜索的效率和相关性大大提高,特别是针对体育科研的搜索效率会大大提高;它能够按照用户的偏好,跟踪、和定位并定期搜集前沿体育科研文献和信息;第二,它是专业化的,面向体育的生产、服务单位的信息服务企业可以购买该搜索引擎进行体育信息服务。使用该搜索引擎的机构可以通过为体育设施、设备生产商和体育场馆开放服务发布信息而赢利,而该搜索引擎的开发商可以通过销售该搜索引擎软件而盈利并扩大影响。应用说明:体育专业因特网智能搜索引擎在现存的搜索引擎系统增加基于知识表示的语义网络--知识库,通过系统与用户交互(人机交互),对用户最初输入的查询词进行精确定义,并给出基于知识的相关语义的词汇作为搜索输入词精确定义后的补充,从而使搜索在精确定义的基础上,按照知识的内容关联(基于知识相关性的语义网)进行全面搜索,并将搜索后的阶段性结果与知识库相对照进行筛选,最终给出以知识特征识别的搜索结果。系统还将专业的检索方法首次应用于搜索引擎,将搜索领域扩入到文本检索以外,进行文献目录检索,包括专利、国家标准、图书馆图书的检索,在用户选定文献目录种类后,经由搜索引擎的知识库判别,再由搜索引擎直接完成目录搜索(用户不必经过搜索引擎之后再访问专利、国家标准、图书馆等体育专业文献的检索系统,而由搜索引擎一次完成)。目前,搜索引擎的流程和体系结构设计已经完成。合作方式:面议。
全学科、全行业智能搜索引擎应用系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该系统由三部分组成:1.搜索引擎:它是该应用系统的核心部分。它有“网络信息主题分类体系”标准(待批国家标准)作为网络信息组织的基础和网络信息查询的大型词表库的支撑,可从16种信息类型、135个行业、8种信息载体快速实现信息三维定位查询;支持目录式搜索和索引式搜索;支持超文本、超媒体搜索方式;同时支持自然语言和受控语言的检索方式;支持同义词联动检索、全文检索、字段检索、组合检索、逐级逼近检索、定题检索服务。2.基于网络环境的中文信息自动标引系统:该系统能对网络爬虫软件从网上自动提取的信息或WEB浏览器输入的批量信息,由计算机自动赋予分类检索标识和主题检索标识,在统一标准的基础上完成网络信息的自动分类标引、主题标引和类目词标引。3.全学科、全行业网络信息分类主题词表及其管理系统:通过科技术语的标准化、信息交流的规范化,实现对全行业、全学科(19个门类、135个行业、学科)的知识信息、工程信息、产品信息进行标准化、规范化、有序化组织,从而达到信息准确的加工、通畅的交流和有效的共享。
基于动态贝叶斯模型的网页垃圾检测方法
成熟度:正在研发
技术类型:发明
应用行业:制造业
技术简介
基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。
网络文摘定制搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该网络平台实现基于搜索引擎、互联网、移动通信、存储管理、智能识别等技术开发的一种新型网络空间,适合大、中、小企业和个人互联网用户。 创新的理念是:在为信息搜索者提供专有空间的同时,使用智能搜索引擎,将用户设定的信息需求准确、及时、自动的存放到自有个性空间,为用户提供及时、方便和安全的信息文摘平台。 调查显示,70%以上的用户通过搜索引擎找到相关的内容。据2006年3月CNNIC的调查数据,中国内地的网民数量达到1.2亿,由此可以看出,搜索引擎已经成为一个实实在在的信息枢纽和信息门户,成为用户获取网络信息的首选工具。 经过10年的市场培养,搜索引擎营销在中国已经收到了普遍的认可。计世资讯(CCW Research)最新的研究报告预计,2006年中国的搜索引擎市场总额将突破20亿元大关,并实现46%左右的增长。计世资讯(CCW Research)认为,中国互联网市场上存在的搜索引擎企业形成了三层梯队:第一层梯队是Google、百度、Yahoo;第二层梯队是中搜、新浪、搜狐、网易;第三层梯队是正在兴起的专业搜索。搜索引擎从一个默默无闻的网络工具在10多年内迅速窜升成为互联网上仅次于邮件的第二大应用,并成为今天的投资人最感兴趣的技术之一,其直接诱因是互联网内容的爆炸式增长。 资料显示,1994年7月在卡内基梅隆大学诞生的第一个真正意义的互联网搜索引擎Lycos,其最初收录索引的只有5.4万个网页,到今天全球影响力最大的搜索引擎Google收录索引已超过80亿个网页,运行搜索引擎从最初的单台服务器到数以几十万计的服务器,依然跟不上互联网信息资源的增长速度,而且毫无疑问,今天的内容正在以前所未有的速度递增,这给我们进行内容的收集和整理带来了很大挑战。 搜索引擎的价值在于将传统的静态环境下的信息检索技术转移到动态、实时的网络环境中,并应用到互联网、外联网和企业内网的信息资源管理和信息利用中去,通过搜索引擎感知企业外部经营环境,进行信息资源开发、管理和利用,进而塑造企业竞争优势。今天,全球化和网络化对企业信息和知识资产的加工共享已经不只局限在提高生产率、有效整合企业资源、降低运营成本这些短期收益方面,更重要的是它已经涉及到企业的核心竞争力、生存力和综合实力的长远问题,已成为流淌在企业生产经营活动中的一种血液,成为另一种无形的生产要素。 在搜索引擎的发展方向上,一方面是追求质量,另一方面是扩展应用。人们对质量的追求总是无穷无尽的,新的搜索引擎技术将会“更准”—更加智能化、结果更让人满意;“更全”—数据容量更大,找到的信息更全;“更快”—查询速度快,内容更新快;“更大”—数据容量更大。扩展应用的关键在于发掘需求、细分需求,满足人的各个方面的需求,例如各种多媒体的专向搜索、各种专业的垂直搜索都会有广阔的市场。 网络文摘定制搜索引擎及时把人们从繁忙中解脱出来,根据人们的需要,在所关注的网站上搜索信息,减少了网民在网上查找资料消耗的时间,及时把相关信息查找出来,极大的提升效率,经验证明:相关主题在行业网站上出现的几率最大,行业网站基本包括了最新成果的相关信息。网络文摘定制搜索引擎作为专业化、个性化的搜索引擎服务将得到极为快速的发展,培育并影响着个人用户进行信息消费的习惯。 它以用户为中心实现了搜索引擎服务从网络信息导航向网络信息服务转变,形成新型信息增值服务的巨大市场空间。 新一轮的搜索技术竞争将在智能化和个性化领域展开,网络文摘定制搜索引擎将会有一个美好的未来。
找到17项技术成果数据。
找技术 >专利数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的专利数据库的搜索方法,一般是用专利名称或关键词的搜索方法,这些方法有众多不便之处。 一种专利数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”设置到的,会在“数据搜索”中出现该分类名称及其信息;没有设置到的,将不会在“数据搜索”中出现该分类名称及其信息。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
面向用户在线学习的多媒体检索系统
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
面向用户在线学习的多媒体检索系统。 本系统采用多媒体计算技术、机器学习技术、模糊映射技术,开发基于内容的多媒体搜索引擎。采用.Net 平台开发基于B/S架构的数字媒体管理系统。系统架构如图1所示。 系统特点: 1. 多媒体搜索引擎能够根据用户的偏好,具有自我在线学习能力,用户能够与系统进行交互,以改善系统检索的准确率。图1 在线学习的多媒体检索系统Figure 1 Multimedia Retrieval System Based on Online Learning 2. 检索算法先进,在保证查全的前提下,具有检索准确率最大化的控制特性。 3. 检索速度快,需要的存储空间小,适合海量多媒体数据库的管理,对新出现的媒体内容,可以采用增量的方式,加载进数据库中。 系统功能: 本系统是针对多媒体的信息化管理设计的,其主要功能如下: 1. 搜索引擎可以适应各种类型的不同格式的多媒体内容检索需求。 2. 能够根据用户的喜好,进行在线学习,使检索的准确率最大化。 3. 通过关键字、素描、多媒体内容,用户可以查询任意一种多媒体数据。 主要技术指标: (1)检索时间:≤2 秒; (2)检索准确率:≥90%; (3)检索查全率:≥95%;
天眼查基于知识图谱的搜索引擎技术及产品
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
天眼查基于知识图谱的搜索引擎技术及产品成果在基于对行业技术状况进行深入调研的基础上,严格遵循《中华人民共和国数据安全法》、《中华人民共和国网络安全法》的基础上,重点分析公开数据分布广泛,不易整合的因素,找到核心技术难点,制定相应技术方案,解决相关问题。 形成全数据集成平台模块,解决数据收集,主要包括数据集成平台和数据收集平台,自动收集框架集成到本研究系统中,新建各种数据自动收集任务,收集互联网相关数据。 形成数据预处理平台模块对经济领域所涉及的各种文本通用处理操作的集成,主要包括 NLP 预处理和词向量预处理。 形成数据标注平台模块解决数据标注对经济领域自动标注算法实现功能展示。 研发知识抽取平台模块建设生成关系抽取器,结合系统其他功能模块,实现对一个句子文本中实体关系三元组的抽取功能。 实现知识图谱可视化平台将构建的经济领域知识图谱以图形式呈现给用户,方便用户观察,通过知识图谱可视化平台进行可视化呈现。
智能搜索引擎关键技术及产业化
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
搜索引擎是获取互联网信息的最重要入口,拥有自主可控的搜索引擎是国家重大战略需求。在智能移动设备迅速普及、人工智能技术快速发展的时代背景下,用户期望以自然语言表达、直接获取正确答案,基于关键词的传统搜索引擎已不能满足便捷、高效、精准地获取信息的需求。面对复杂多样的自然语言查询和浩如烟海的互联网数据,深刻理解需求、精准给出答案成为搜索领域世界公认难题。创新地融合知识图谱及深度学习技术,研发深刻理解意图、精准呈现结果、自然便捷交互的智能搜索引擎,是解决公认难题的必由之路。正是搜索引擎的智能化,造就了百度中文搜索引擎与时俱进,继续成为亿万网民获取信息的最主要入口。该项目在大规模知识图谱、基于深度语义分析的需求理解、基于深度学习的搜索排序、语音交互等方面取得重大突破,研发了自主可控的智能搜索引擎,占据了该领域的技术制高点。核心创新点如下:提出了大规模中文知识图谱构建及计算技术。突破了传统知识获取规模小、成本高、效率低的瓶颈。构建了全球最大的中文知识图谱,在知识图谱规模、图谱数据容量及检索性能等指标上达到国际领先水平。提出了基于知识图谱和深度语义分析的需求理解模型,实现对用户直接意图的精准识别、动态预测以及潜在意图的提前发现和主动推荐。意图识别准确率达95%,动态预测提升搜索效率10倍,并为85%的查询主动推荐相关结果。提出了基于深度学习的搜索排序算法,结合深度问答技术,突破了语义相关性弱、搜索结果不直观的瓶颈。在国际上首次将深度学习应用于搜索引擎,搜索结果准确率达85%,每日为超过2亿条查询直接提供正确答案。提出了语音、语言、搜索一体优化的语音搜索技术。解决了口语化查询识别和理解准确率低、自然网页难以直接播报的难题。百度深度学习语音识别入选《麻省理工评论》2016年“十大突破技术”。每天响应超过6亿次语音请求,为用户提供了更为便利的体验,并惠及盲人、老人、儿童等群体。上述成果申请发明专利401项,已获授权205项,其中国际授权发明专利12项,在ACL、SIGIR、AAAI等领域顶级会议发表论文103篇。成果被院士专家鉴定为在中文搜索领域及知识图谱规模、图谱数据容量及检索性能、中文智能问答覆盖率及准确率等多项指标上“达到国际领先水平”。百度智能搜索产品,拥有6亿多用户,日均响应搜索约60亿次。多次获得习近平总书记、李克强总理等国家领导人称赞,全国人大常委会原副委员长、中国科学院原院长路甬祥院士在视察智能搜索成果时称赞百度是“新时代的民族英雄”。从2015年1月到2017年6月,取得直接经济效益170.56亿元,通过服务百度集团实现间接经济效益1062.06亿元。项目成果还服务了超过100万家企事业单位,带动相关产业经济效益5.3万亿元。成果曾分别获2013年和2017年中国电子学会科学技术奖一等奖。
移动美食搜索引擎系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
课题来源与背景:搜索美食引擎必须有用户行为分析功能,能够记录用户的搜索历史,进而得出用户的喜好模型,给用户提供更加贴近需求的搜索结果。人们通常只是通过少量关键词与检索系统进行沟通,检索系统往往不能比较准确地返回用户所真正需求的信息。因此,进行搜索美食引擎的用户行为分析是非常必要的。研究目的与意义:当前互联网搜索的主要盈利模式是“竞价排名”能够对搜索结果进行适配,更好的在用户的手机上展示。适配包括文字长短裁减,媒体格式适配等。和“广告位购买”,手机搜索是从互联网模式发展起来的,因此不妨借鉴互联网搜索的盈利模式。主要论点与论据移动搜索是一个很有发展前景的业务,国内外移引擎公司合作。搜索美食引擎公司也有从互联网搜索扩展到移动搜索的强劲动力。创见与创新:内容具有成本,这些信息必须经过收集整理,并时常更新。运营商不可能免费获得这些信息,很可能要从专业的机构或者cP/SP购买,要付出一定的成本。因此对于本地信息,出于成本的考虑,运营商有收费的需求;而由于可以给出精确的搜索结果,本地搜索也有收费的可能。另外,搜索美食引擎必须支持自然语句搜索并对搜索请求进行语义分析,给出更加符合用户要求的结果。展现适配不同的手机性能和功能是一样的,搜索美食引擎应该具有适配性。社会经济效益,存在的问题:移动搜索业务之所以受到越来越多的关注,一方竞价排名是搜索美食引擎关键词广告的一种形式,按照付费最高者排名靠前的原则,对购买了同一关键词的网站进行排名的一种方式。竞价排名一般采取按点击收费的方式。竞价排名是搜索美食引擎公司的主要收益来源。广告位购买是在搜索美食引擎的主页和返回搜索结果页面的固定位置,设置广告位,由广告主来购买。对广告主客户来讲,手机搜索的广告比互联网搜索的广告更具吸引力。众所周知,手机广告因其具有传统媒介无可比拟的优势,即分众,定向,及时,互动,传播而成为最受广告界关注的“第五媒体”。手机媒体的互动性使广告信息传递的速度和广告质量有更大提高,新技术应用有助于用户行为的记录和评估,用户数据库的数据更为精确,定向和定位技术的普及使得能对广告受众进行细致而准确的分类,即提高目标受众覆盖率,也降低成本。经过顾客的许可,广告商可以收集非常有价值的用户信息以及行为信息作为市场营销目的,手机广告已经从简单的SMS广告发展到比较复杂的多媒体广告。而手机广告一旦和手机搜索结合,就会产生更大的效益。因为手机搜过的广告更具针对性,广告的效率更高。首先当用户使用手机搜索某个关键词,一定是他的需求非常急迫,否则可能会借助互联网工具搜索;其次由于手机搜索不能象互联网搜索那样给用户推送海量的搜索结果,因此借助手机搜索推出的广告面是它给普通用户带来了方便,另一方面是因为它潜在的盈利可能。
图书数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的图书数据库的搜索方法,一般是用书名或关键词的搜索方法,这些方法有众多不便之处。 一种图书数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”没有设置到的,将不会在“数据搜索”中出现该分类名称,方便、明显地展示已经发布的信息分类。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。数据库的类型分类,按照“图书分类法”、“出版社”,单独或两者结合起来,这样即可搜索出图书的“图书名、作者、图书简介、联系方式”等。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
体育产业专业智能搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
体育专业搜索引擎与因特网上普通的搜索引擎相比,特点和作用有两个:第一,它是智能化的,对于体育领域信息搜索的效率和相关性大大提高,特别是针对体育科研的搜索效率会大大提高;它能够按照用户的偏好,跟踪、和定位并定期搜集前沿体育科研文献和信息;第二,它是专业化的,面向体育的生产、服务单位的信息服务企业可以购买该搜索引擎进行体育信息服务。使用该搜索引擎的机构可以通过为体育设施、设备生产商和体育场馆开放服务发布信息而赢利,而该搜索引擎的开发商可以通过销售该搜索引擎软件而盈利并扩大影响。应用说明:体育专业因特网智能搜索引擎在现存的搜索引擎系统增加基于知识表示的语义网络--知识库,通过系统与用户交互(人机交互),对用户最初输入的查询词进行精确定义,并给出基于知识的相关语义的词汇作为搜索输入词精确定义后的补充,从而使搜索在精确定义的基础上,按照知识的内容关联(基于知识相关性的语义网)进行全面搜索,并将搜索后的阶段性结果与知识库相对照进行筛选,最终给出以知识特征识别的搜索结果。系统还将专业的检索方法首次应用于搜索引擎,将搜索领域扩入到文本检索以外,进行文献目录检索,包括专利、国家标准、图书馆图书的检索,在用户选定文献目录种类后,经由搜索引擎的知识库判别,再由搜索引擎直接完成目录搜索(用户不必经过搜索引擎之后再访问专利、国家标准、图书馆等体育专业文献的检索系统,而由搜索引擎一次完成)。目前,搜索引擎的流程和体系结构设计已经完成。合作方式:面议。
全学科、全行业智能搜索引擎应用系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该系统由三部分组成:1.搜索引擎:它是该应用系统的核心部分。它有“网络信息主题分类体系”标准(待批国家标准)作为网络信息组织的基础和网络信息查询的大型词表库的支撑,可从16种信息类型、135个行业、8种信息载体快速实现信息三维定位查询;支持目录式搜索和索引式搜索;支持超文本、超媒体搜索方式;同时支持自然语言和受控语言的检索方式;支持同义词联动检索、全文检索、字段检索、组合检索、逐级逼近检索、定题检索服务。2.基于网络环境的中文信息自动标引系统:该系统能对网络爬虫软件从网上自动提取的信息或WEB浏览器输入的批量信息,由计算机自动赋予分类检索标识和主题检索标识,在统一标准的基础上完成网络信息的自动分类标引、主题标引和类目词标引。3.全学科、全行业网络信息分类主题词表及其管理系统:通过科技术语的标准化、信息交流的规范化,实现对全行业、全学科(19个门类、135个行业、学科)的知识信息、工程信息、产品信息进行标准化、规范化、有序化组织,从而达到信息准确的加工、通畅的交流和有效的共享。
基于动态贝叶斯模型的网页垃圾检测方法
成熟度:正在研发
技术类型:发明
应用行业:制造业
技术简介
基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。
网络文摘定制搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该网络平台实现基于搜索引擎、互联网、移动通信、存储管理、智能识别等技术开发的一种新型网络空间,适合大、中、小企业和个人互联网用户。 创新的理念是:在为信息搜索者提供专有空间的同时,使用智能搜索引擎,将用户设定的信息需求准确、及时、自动的存放到自有个性空间,为用户提供及时、方便和安全的信息文摘平台。 调查显示,70%以上的用户通过搜索引擎找到相关的内容。据2006年3月CNNIC的调查数据,中国内地的网民数量达到1.2亿,由此可以看出,搜索引擎已经成为一个实实在在的信息枢纽和信息门户,成为用户获取网络信息的首选工具。 经过10年的市场培养,搜索引擎营销在中国已经收到了普遍的认可。计世资讯(CCW Research)最新的研究报告预计,2006年中国的搜索引擎市场总额将突破20亿元大关,并实现46%左右的增长。计世资讯(CCW Research)认为,中国互联网市场上存在的搜索引擎企业形成了三层梯队:第一层梯队是Google、百度、Yahoo;第二层梯队是中搜、新浪、搜狐、网易;第三层梯队是正在兴起的专业搜索。搜索引擎从一个默默无闻的网络工具在10多年内迅速窜升成为互联网上仅次于邮件的第二大应用,并成为今天的投资人最感兴趣的技术之一,其直接诱因是互联网内容的爆炸式增长。 资料显示,1994年7月在卡内基梅隆大学诞生的第一个真正意义的互联网搜索引擎Lycos,其最初收录索引的只有5.4万个网页,到今天全球影响力最大的搜索引擎Google收录索引已超过80亿个网页,运行搜索引擎从最初的单台服务器到数以几十万计的服务器,依然跟不上互联网信息资源的增长速度,而且毫无疑问,今天的内容正在以前所未有的速度递增,这给我们进行内容的收集和整理带来了很大挑战。 搜索引擎的价值在于将传统的静态环境下的信息检索技术转移到动态、实时的网络环境中,并应用到互联网、外联网和企业内网的信息资源管理和信息利用中去,通过搜索引擎感知企业外部经营环境,进行信息资源开发、管理和利用,进而塑造企业竞争优势。今天,全球化和网络化对企业信息和知识资产的加工共享已经不只局限在提高生产率、有效整合企业资源、降低运营成本这些短期收益方面,更重要的是它已经涉及到企业的核心竞争力、生存力和综合实力的长远问题,已成为流淌在企业生产经营活动中的一种血液,成为另一种无形的生产要素。 在搜索引擎的发展方向上,一方面是追求质量,另一方面是扩展应用。人们对质量的追求总是无穷无尽的,新的搜索引擎技术将会“更准”—更加智能化、结果更让人满意;“更全”—数据容量更大,找到的信息更全;“更快”—查询速度快,内容更新快;“更大”—数据容量更大。扩展应用的关键在于发掘需求、细分需求,满足人的各个方面的需求,例如各种多媒体的专向搜索、各种专业的垂直搜索都会有广阔的市场。 网络文摘定制搜索引擎及时把人们从繁忙中解脱出来,根据人们的需要,在所关注的网站上搜索信息,减少了网民在网上查找资料消耗的时间,及时把相关信息查找出来,极大的提升效率,经验证明:相关主题在行业网站上出现的几率最大,行业网站基本包括了最新成果的相关信息。网络文摘定制搜索引擎作为专业化、个性化的搜索引擎服务将得到极为快速的发展,培育并影响着个人用户进行信息消费的习惯。 它以用户为中心实现了搜索引擎服务从网络信息导航向网络信息服务转变,形成新型信息增值服务的巨大市场空间。 新一轮的搜索技术竞争将在智能化和个性化领域展开,网络文摘定制搜索引擎将会有一个美好的未来。
找到17项技术成果数据。
找技术 >专利数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的专利数据库的搜索方法,一般是用专利名称或关键词的搜索方法,这些方法有众多不便之处。 一种专利数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”设置到的,会在“数据搜索”中出现该分类名称及其信息;没有设置到的,将不会在“数据搜索”中出现该分类名称及其信息。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
面向用户在线学习的多媒体检索系统
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
面向用户在线学习的多媒体检索系统。 本系统采用多媒体计算技术、机器学习技术、模糊映射技术,开发基于内容的多媒体搜索引擎。采用.Net 平台开发基于B/S架构的数字媒体管理系统。系统架构如图1所示。 系统特点: 1. 多媒体搜索引擎能够根据用户的偏好,具有自我在线学习能力,用户能够与系统进行交互,以改善系统检索的准确率。图1 在线学习的多媒体检索系统Figure 1 Multimedia Retrieval System Based on Online Learning 2. 检索算法先进,在保证查全的前提下,具有检索准确率最大化的控制特性。 3. 检索速度快,需要的存储空间小,适合海量多媒体数据库的管理,对新出现的媒体内容,可以采用增量的方式,加载进数据库中。 系统功能: 本系统是针对多媒体的信息化管理设计的,其主要功能如下: 1. 搜索引擎可以适应各种类型的不同格式的多媒体内容检索需求。 2. 能够根据用户的喜好,进行在线学习,使检索的准确率最大化。 3. 通过关键字、素描、多媒体内容,用户可以查询任意一种多媒体数据。 主要技术指标: (1)检索时间:≤2 秒; (2)检索准确率:≥90%; (3)检索查全率:≥95%;
天眼查基于知识图谱的搜索引擎技术及产品
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
天眼查基于知识图谱的搜索引擎技术及产品成果在基于对行业技术状况进行深入调研的基础上,严格遵循《中华人民共和国数据安全法》、《中华人民共和国网络安全法》的基础上,重点分析公开数据分布广泛,不易整合的因素,找到核心技术难点,制定相应技术方案,解决相关问题。 形成全数据集成平台模块,解决数据收集,主要包括数据集成平台和数据收集平台,自动收集框架集成到本研究系统中,新建各种数据自动收集任务,收集互联网相关数据。 形成数据预处理平台模块对经济领域所涉及的各种文本通用处理操作的集成,主要包括 NLP 预处理和词向量预处理。 形成数据标注平台模块解决数据标注对经济领域自动标注算法实现功能展示。 研发知识抽取平台模块建设生成关系抽取器,结合系统其他功能模块,实现对一个句子文本中实体关系三元组的抽取功能。 实现知识图谱可视化平台将构建的经济领域知识图谱以图形式呈现给用户,方便用户观察,通过知识图谱可视化平台进行可视化呈现。
智能搜索引擎关键技术及产业化
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
搜索引擎是获取互联网信息的最重要入口,拥有自主可控的搜索引擎是国家重大战略需求。在智能移动设备迅速普及、人工智能技术快速发展的时代背景下,用户期望以自然语言表达、直接获取正确答案,基于关键词的传统搜索引擎已不能满足便捷、高效、精准地获取信息的需求。面对复杂多样的自然语言查询和浩如烟海的互联网数据,深刻理解需求、精准给出答案成为搜索领域世界公认难题。创新地融合知识图谱及深度学习技术,研发深刻理解意图、精准呈现结果、自然便捷交互的智能搜索引擎,是解决公认难题的必由之路。正是搜索引擎的智能化,造就了百度中文搜索引擎与时俱进,继续成为亿万网民获取信息的最主要入口。该项目在大规模知识图谱、基于深度语义分析的需求理解、基于深度学习的搜索排序、语音交互等方面取得重大突破,研发了自主可控的智能搜索引擎,占据了该领域的技术制高点。核心创新点如下:提出了大规模中文知识图谱构建及计算技术。突破了传统知识获取规模小、成本高、效率低的瓶颈。构建了全球最大的中文知识图谱,在知识图谱规模、图谱数据容量及检索性能等指标上达到国际领先水平。提出了基于知识图谱和深度语义分析的需求理解模型,实现对用户直接意图的精准识别、动态预测以及潜在意图的提前发现和主动推荐。意图识别准确率达95%,动态预测提升搜索效率10倍,并为85%的查询主动推荐相关结果。提出了基于深度学习的搜索排序算法,结合深度问答技术,突破了语义相关性弱、搜索结果不直观的瓶颈。在国际上首次将深度学习应用于搜索引擎,搜索结果准确率达85%,每日为超过2亿条查询直接提供正确答案。提出了语音、语言、搜索一体优化的语音搜索技术。解决了口语化查询识别和理解准确率低、自然网页难以直接播报的难题。百度深度学习语音识别入选《麻省理工评论》2016年“十大突破技术”。每天响应超过6亿次语音请求,为用户提供了更为便利的体验,并惠及盲人、老人、儿童等群体。上述成果申请发明专利401项,已获授权205项,其中国际授权发明专利12项,在ACL、SIGIR、AAAI等领域顶级会议发表论文103篇。成果被院士专家鉴定为在中文搜索领域及知识图谱规模、图谱数据容量及检索性能、中文智能问答覆盖率及准确率等多项指标上“达到国际领先水平”。百度智能搜索产品,拥有6亿多用户,日均响应搜索约60亿次。多次获得习近平总书记、李克强总理等国家领导人称赞,全国人大常委会原副委员长、中国科学院原院长路甬祥院士在视察智能搜索成果时称赞百度是“新时代的民族英雄”。从2015年1月到2017年6月,取得直接经济效益170.56亿元,通过服务百度集团实现间接经济效益1062.06亿元。项目成果还服务了超过100万家企事业单位,带动相关产业经济效益5.3万亿元。成果曾分别获2013年和2017年中国电子学会科学技术奖一等奖。
移动美食搜索引擎系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
课题来源与背景:搜索美食引擎必须有用户行为分析功能,能够记录用户的搜索历史,进而得出用户的喜好模型,给用户提供更加贴近需求的搜索结果。人们通常只是通过少量关键词与检索系统进行沟通,检索系统往往不能比较准确地返回用户所真正需求的信息。因此,进行搜索美食引擎的用户行为分析是非常必要的。研究目的与意义:当前互联网搜索的主要盈利模式是“竞价排名”能够对搜索结果进行适配,更好的在用户的手机上展示。适配包括文字长短裁减,媒体格式适配等。和“广告位购买”,手机搜索是从互联网模式发展起来的,因此不妨借鉴互联网搜索的盈利模式。主要论点与论据移动搜索是一个很有发展前景的业务,国内外移引擎公司合作。搜索美食引擎公司也有从互联网搜索扩展到移动搜索的强劲动力。创见与创新:内容具有成本,这些信息必须经过收集整理,并时常更新。运营商不可能免费获得这些信息,很可能要从专业的机构或者cP/SP购买,要付出一定的成本。因此对于本地信息,出于成本的考虑,运营商有收费的需求;而由于可以给出精确的搜索结果,本地搜索也有收费的可能。另外,搜索美食引擎必须支持自然语句搜索并对搜索请求进行语义分析,给出更加符合用户要求的结果。展现适配不同的手机性能和功能是一样的,搜索美食引擎应该具有适配性。社会经济效益,存在的问题:移动搜索业务之所以受到越来越多的关注,一方竞价排名是搜索美食引擎关键词广告的一种形式,按照付费最高者排名靠前的原则,对购买了同一关键词的网站进行排名的一种方式。竞价排名一般采取按点击收费的方式。竞价排名是搜索美食引擎公司的主要收益来源。广告位购买是在搜索美食引擎的主页和返回搜索结果页面的固定位置,设置广告位,由广告主来购买。对广告主客户来讲,手机搜索的广告比互联网搜索的广告更具吸引力。众所周知,手机广告因其具有传统媒介无可比拟的优势,即分众,定向,及时,互动,传播而成为最受广告界关注的“第五媒体”。手机媒体的互动性使广告信息传递的速度和广告质量有更大提高,新技术应用有助于用户行为的记录和评估,用户数据库的数据更为精确,定向和定位技术的普及使得能对广告受众进行细致而准确的分类,即提高目标受众覆盖率,也降低成本。经过顾客的许可,广告商可以收集非常有价值的用户信息以及行为信息作为市场营销目的,手机广告已经从简单的SMS广告发展到比较复杂的多媒体广告。而手机广告一旦和手机搜索结合,就会产生更大的效益。因为手机搜过的广告更具针对性,广告的效率更高。首先当用户使用手机搜索某个关键词,一定是他的需求非常急迫,否则可能会借助互联网工具搜索;其次由于手机搜索不能象互联网搜索那样给用户推送海量的搜索结果,因此借助手机搜索推出的广告面是它给普通用户带来了方便,另一方面是因为它潜在的盈利可能。
图书数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的图书数据库的搜索方法,一般是用书名或关键词的搜索方法,这些方法有众多不便之处。 一种图书数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”没有设置到的,将不会在“数据搜索”中出现该分类名称,方便、明显地展示已经发布的信息分类。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。数据库的类型分类,按照“图书分类法”、“出版社”,单独或两者结合起来,这样即可搜索出图书的“图书名、作者、图书简介、联系方式”等。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
体育产业专业智能搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
体育专业搜索引擎与因特网上普通的搜索引擎相比,特点和作用有两个:第一,它是智能化的,对于体育领域信息搜索的效率和相关性大大提高,特别是针对体育科研的搜索效率会大大提高;它能够按照用户的偏好,跟踪、和定位并定期搜集前沿体育科研文献和信息;第二,它是专业化的,面向体育的生产、服务单位的信息服务企业可以购买该搜索引擎进行体育信息服务。使用该搜索引擎的机构可以通过为体育设施、设备生产商和体育场馆开放服务发布信息而赢利,而该搜索引擎的开发商可以通过销售该搜索引擎软件而盈利并扩大影响。应用说明:体育专业因特网智能搜索引擎在现存的搜索引擎系统增加基于知识表示的语义网络--知识库,通过系统与用户交互(人机交互),对用户最初输入的查询词进行精确定义,并给出基于知识的相关语义的词汇作为搜索输入词精确定义后的补充,从而使搜索在精确定义的基础上,按照知识的内容关联(基于知识相关性的语义网)进行全面搜索,并将搜索后的阶段性结果与知识库相对照进行筛选,最终给出以知识特征识别的搜索结果。系统还将专业的检索方法首次应用于搜索引擎,将搜索领域扩入到文本检索以外,进行文献目录检索,包括专利、国家标准、图书馆图书的检索,在用户选定文献目录种类后,经由搜索引擎的知识库判别,再由搜索引擎直接完成目录搜索(用户不必经过搜索引擎之后再访问专利、国家标准、图书馆等体育专业文献的检索系统,而由搜索引擎一次完成)。目前,搜索引擎的流程和体系结构设计已经完成。合作方式:面议。
全学科、全行业智能搜索引擎应用系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该系统由三部分组成:1.搜索引擎:它是该应用系统的核心部分。它有“网络信息主题分类体系”标准(待批国家标准)作为网络信息组织的基础和网络信息查询的大型词表库的支撑,可从16种信息类型、135个行业、8种信息载体快速实现信息三维定位查询;支持目录式搜索和索引式搜索;支持超文本、超媒体搜索方式;同时支持自然语言和受控语言的检索方式;支持同义词联动检索、全文检索、字段检索、组合检索、逐级逼近检索、定题检索服务。2.基于网络环境的中文信息自动标引系统:该系统能对网络爬虫软件从网上自动提取的信息或WEB浏览器输入的批量信息,由计算机自动赋予分类检索标识和主题检索标识,在统一标准的基础上完成网络信息的自动分类标引、主题标引和类目词标引。3.全学科、全行业网络信息分类主题词表及其管理系统:通过科技术语的标准化、信息交流的规范化,实现对全行业、全学科(19个门类、135个行业、学科)的知识信息、工程信息、产品信息进行标准化、规范化、有序化组织,从而达到信息准确的加工、通畅的交流和有效的共享。
基于动态贝叶斯模型的网页垃圾检测方法
成熟度:正在研发
技术类型:发明
应用行业:制造业
技术简介
基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。
网络文摘定制搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该网络平台实现基于搜索引擎、互联网、移动通信、存储管理、智能识别等技术开发的一种新型网络空间,适合大、中、小企业和个人互联网用户。 创新的理念是:在为信息搜索者提供专有空间的同时,使用智能搜索引擎,将用户设定的信息需求准确、及时、自动的存放到自有个性空间,为用户提供及时、方便和安全的信息文摘平台。 调查显示,70%以上的用户通过搜索引擎找到相关的内容。据2006年3月CNNIC的调查数据,中国内地的网民数量达到1.2亿,由此可以看出,搜索引擎已经成为一个实实在在的信息枢纽和信息门户,成为用户获取网络信息的首选工具。 经过10年的市场培养,搜索引擎营销在中国已经收到了普遍的认可。计世资讯(CCW Research)最新的研究报告预计,2006年中国的搜索引擎市场总额将突破20亿元大关,并实现46%左右的增长。计世资讯(CCW Research)认为,中国互联网市场上存在的搜索引擎企业形成了三层梯队:第一层梯队是Google、百度、Yahoo;第二层梯队是中搜、新浪、搜狐、网易;第三层梯队是正在兴起的专业搜索。搜索引擎从一个默默无闻的网络工具在10多年内迅速窜升成为互联网上仅次于邮件的第二大应用,并成为今天的投资人最感兴趣的技术之一,其直接诱因是互联网内容的爆炸式增长。 资料显示,1994年7月在卡内基梅隆大学诞生的第一个真正意义的互联网搜索引擎Lycos,其最初收录索引的只有5.4万个网页,到今天全球影响力最大的搜索引擎Google收录索引已超过80亿个网页,运行搜索引擎从最初的单台服务器到数以几十万计的服务器,依然跟不上互联网信息资源的增长速度,而且毫无疑问,今天的内容正在以前所未有的速度递增,这给我们进行内容的收集和整理带来了很大挑战。 搜索引擎的价值在于将传统的静态环境下的信息检索技术转移到动态、实时的网络环境中,并应用到互联网、外联网和企业内网的信息资源管理和信息利用中去,通过搜索引擎感知企业外部经营环境,进行信息资源开发、管理和利用,进而塑造企业竞争优势。今天,全球化和网络化对企业信息和知识资产的加工共享已经不只局限在提高生产率、有效整合企业资源、降低运营成本这些短期收益方面,更重要的是它已经涉及到企业的核心竞争力、生存力和综合实力的长远问题,已成为流淌在企业生产经营活动中的一种血液,成为另一种无形的生产要素。 在搜索引擎的发展方向上,一方面是追求质量,另一方面是扩展应用。人们对质量的追求总是无穷无尽的,新的搜索引擎技术将会“更准”—更加智能化、结果更让人满意;“更全”—数据容量更大,找到的信息更全;“更快”—查询速度快,内容更新快;“更大”—数据容量更大。扩展应用的关键在于发掘需求、细分需求,满足人的各个方面的需求,例如各种多媒体的专向搜索、各种专业的垂直搜索都会有广阔的市场。 网络文摘定制搜索引擎及时把人们从繁忙中解脱出来,根据人们的需要,在所关注的网站上搜索信息,减少了网民在网上查找资料消耗的时间,及时把相关信息查找出来,极大的提升效率,经验证明:相关主题在行业网站上出现的几率最大,行业网站基本包括了最新成果的相关信息。网络文摘定制搜索引擎作为专业化、个性化的搜索引擎服务将得到极为快速的发展,培育并影响着个人用户进行信息消费的习惯。 它以用户为中心实现了搜索引擎服务从网络信息导航向网络信息服务转变,形成新型信息增值服务的巨大市场空间。 新一轮的搜索技术竞争将在智能化和个性化领域展开,网络文摘定制搜索引擎将会有一个美好的未来。
找到17项技术成果数据。
找技术 >专利数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的专利数据库的搜索方法,一般是用专利名称或关键词的搜索方法,这些方法有众多不便之处。 一种专利数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”设置到的,会在“数据搜索”中出现该分类名称及其信息;没有设置到的,将不会在“数据搜索”中出现该分类名称及其信息。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
面向用户在线学习的多媒体检索系统
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
面向用户在线学习的多媒体检索系统。 本系统采用多媒体计算技术、机器学习技术、模糊映射技术,开发基于内容的多媒体搜索引擎。采用.Net 平台开发基于B/S架构的数字媒体管理系统。系统架构如图1所示。 系统特点: 1. 多媒体搜索引擎能够根据用户的偏好,具有自我在线学习能力,用户能够与系统进行交互,以改善系统检索的准确率。图1 在线学习的多媒体检索系统Figure 1 Multimedia Retrieval System Based on Online Learning 2. 检索算法先进,在保证查全的前提下,具有检索准确率最大化的控制特性。 3. 检索速度快,需要的存储空间小,适合海量多媒体数据库的管理,对新出现的媒体内容,可以采用增量的方式,加载进数据库中。 系统功能: 本系统是针对多媒体的信息化管理设计的,其主要功能如下: 1. 搜索引擎可以适应各种类型的不同格式的多媒体内容检索需求。 2. 能够根据用户的喜好,进行在线学习,使检索的准确率最大化。 3. 通过关键字、素描、多媒体内容,用户可以查询任意一种多媒体数据。 主要技术指标: (1)检索时间:≤2 秒; (2)检索准确率:≥90%; (3)检索查全率:≥95%;
天眼查基于知识图谱的搜索引擎技术及产品
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
天眼查基于知识图谱的搜索引擎技术及产品成果在基于对行业技术状况进行深入调研的基础上,严格遵循《中华人民共和国数据安全法》、《中华人民共和国网络安全法》的基础上,重点分析公开数据分布广泛,不易整合的因素,找到核心技术难点,制定相应技术方案,解决相关问题。 形成全数据集成平台模块,解决数据收集,主要包括数据集成平台和数据收集平台,自动收集框架集成到本研究系统中,新建各种数据自动收集任务,收集互联网相关数据。 形成数据预处理平台模块对经济领域所涉及的各种文本通用处理操作的集成,主要包括 NLP 预处理和词向量预处理。 形成数据标注平台模块解决数据标注对经济领域自动标注算法实现功能展示。 研发知识抽取平台模块建设生成关系抽取器,结合系统其他功能模块,实现对一个句子文本中实体关系三元组的抽取功能。 实现知识图谱可视化平台将构建的经济领域知识图谱以图形式呈现给用户,方便用户观察,通过知识图谱可视化平台进行可视化呈现。
智能搜索引擎关键技术及产业化
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
搜索引擎是获取互联网信息的最重要入口,拥有自主可控的搜索引擎是国家重大战略需求。在智能移动设备迅速普及、人工智能技术快速发展的时代背景下,用户期望以自然语言表达、直接获取正确答案,基于关键词的传统搜索引擎已不能满足便捷、高效、精准地获取信息的需求。面对复杂多样的自然语言查询和浩如烟海的互联网数据,深刻理解需求、精准给出答案成为搜索领域世界公认难题。创新地融合知识图谱及深度学习技术,研发深刻理解意图、精准呈现结果、自然便捷交互的智能搜索引擎,是解决公认难题的必由之路。正是搜索引擎的智能化,造就了百度中文搜索引擎与时俱进,继续成为亿万网民获取信息的最主要入口。该项目在大规模知识图谱、基于深度语义分析的需求理解、基于深度学习的搜索排序、语音交互等方面取得重大突破,研发了自主可控的智能搜索引擎,占据了该领域的技术制高点。核心创新点如下:提出了大规模中文知识图谱构建及计算技术。突破了传统知识获取规模小、成本高、效率低的瓶颈。构建了全球最大的中文知识图谱,在知识图谱规模、图谱数据容量及检索性能等指标上达到国际领先水平。提出了基于知识图谱和深度语义分析的需求理解模型,实现对用户直接意图的精准识别、动态预测以及潜在意图的提前发现和主动推荐。意图识别准确率达95%,动态预测提升搜索效率10倍,并为85%的查询主动推荐相关结果。提出了基于深度学习的搜索排序算法,结合深度问答技术,突破了语义相关性弱、搜索结果不直观的瓶颈。在国际上首次将深度学习应用于搜索引擎,搜索结果准确率达85%,每日为超过2亿条查询直接提供正确答案。提出了语音、语言、搜索一体优化的语音搜索技术。解决了口语化查询识别和理解准确率低、自然网页难以直接播报的难题。百度深度学习语音识别入选《麻省理工评论》2016年“十大突破技术”。每天响应超过6亿次语音请求,为用户提供了更为便利的体验,并惠及盲人、老人、儿童等群体。上述成果申请发明专利401项,已获授权205项,其中国际授权发明专利12项,在ACL、SIGIR、AAAI等领域顶级会议发表论文103篇。成果被院士专家鉴定为在中文搜索领域及知识图谱规模、图谱数据容量及检索性能、中文智能问答覆盖率及准确率等多项指标上“达到国际领先水平”。百度智能搜索产品,拥有6亿多用户,日均响应搜索约60亿次。多次获得习近平总书记、李克强总理等国家领导人称赞,全国人大常委会原副委员长、中国科学院原院长路甬祥院士在视察智能搜索成果时称赞百度是“新时代的民族英雄”。从2015年1月到2017年6月,取得直接经济效益170.56亿元,通过服务百度集团实现间接经济效益1062.06亿元。项目成果还服务了超过100万家企事业单位,带动相关产业经济效益5.3万亿元。成果曾分别获2013年和2017年中国电子学会科学技术奖一等奖。
移动美食搜索引擎系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
课题来源与背景:搜索美食引擎必须有用户行为分析功能,能够记录用户的搜索历史,进而得出用户的喜好模型,给用户提供更加贴近需求的搜索结果。人们通常只是通过少量关键词与检索系统进行沟通,检索系统往往不能比较准确地返回用户所真正需求的信息。因此,进行搜索美食引擎的用户行为分析是非常必要的。研究目的与意义:当前互联网搜索的主要盈利模式是“竞价排名”能够对搜索结果进行适配,更好的在用户的手机上展示。适配包括文字长短裁减,媒体格式适配等。和“广告位购买”,手机搜索是从互联网模式发展起来的,因此不妨借鉴互联网搜索的盈利模式。主要论点与论据移动搜索是一个很有发展前景的业务,国内外移引擎公司合作。搜索美食引擎公司也有从互联网搜索扩展到移动搜索的强劲动力。创见与创新:内容具有成本,这些信息必须经过收集整理,并时常更新。运营商不可能免费获得这些信息,很可能要从专业的机构或者cP/SP购买,要付出一定的成本。因此对于本地信息,出于成本的考虑,运营商有收费的需求;而由于可以给出精确的搜索结果,本地搜索也有收费的可能。另外,搜索美食引擎必须支持自然语句搜索并对搜索请求进行语义分析,给出更加符合用户要求的结果。展现适配不同的手机性能和功能是一样的,搜索美食引擎应该具有适配性。社会经济效益,存在的问题:移动搜索业务之所以受到越来越多的关注,一方竞价排名是搜索美食引擎关键词广告的一种形式,按照付费最高者排名靠前的原则,对购买了同一关键词的网站进行排名的一种方式。竞价排名一般采取按点击收费的方式。竞价排名是搜索美食引擎公司的主要收益来源。广告位购买是在搜索美食引擎的主页和返回搜索结果页面的固定位置,设置广告位,由广告主来购买。对广告主客户来讲,手机搜索的广告比互联网搜索的广告更具吸引力。众所周知,手机广告因其具有传统媒介无可比拟的优势,即分众,定向,及时,互动,传播而成为最受广告界关注的“第五媒体”。手机媒体的互动性使广告信息传递的速度和广告质量有更大提高,新技术应用有助于用户行为的记录和评估,用户数据库的数据更为精确,定向和定位技术的普及使得能对广告受众进行细致而准确的分类,即提高目标受众覆盖率,也降低成本。经过顾客的许可,广告商可以收集非常有价值的用户信息以及行为信息作为市场营销目的,手机广告已经从简单的SMS广告发展到比较复杂的多媒体广告。而手机广告一旦和手机搜索结合,就会产生更大的效益。因为手机搜过的广告更具针对性,广告的效率更高。首先当用户使用手机搜索某个关键词,一定是他的需求非常急迫,否则可能会借助互联网工具搜索;其次由于手机搜索不能象互联网搜索那样给用户推送海量的搜索结果,因此借助手机搜索推出的广告面是它给普通用户带来了方便,另一方面是因为它潜在的盈利可能。
图书数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的图书数据库的搜索方法,一般是用书名或关键词的搜索方法,这些方法有众多不便之处。 一种图书数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”没有设置到的,将不会在“数据搜索”中出现该分类名称,方便、明显地展示已经发布的信息分类。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。数据库的类型分类,按照“图书分类法”、“出版社”,单独或两者结合起来,这样即可搜索出图书的“图书名、作者、图书简介、联系方式”等。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
体育产业专业智能搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
体育专业搜索引擎与因特网上普通的搜索引擎相比,特点和作用有两个:第一,它是智能化的,对于体育领域信息搜索的效率和相关性大大提高,特别是针对体育科研的搜索效率会大大提高;它能够按照用户的偏好,跟踪、和定位并定期搜集前沿体育科研文献和信息;第二,它是专业化的,面向体育的生产、服务单位的信息服务企业可以购买该搜索引擎进行体育信息服务。使用该搜索引擎的机构可以通过为体育设施、设备生产商和体育场馆开放服务发布信息而赢利,而该搜索引擎的开发商可以通过销售该搜索引擎软件而盈利并扩大影响。应用说明:体育专业因特网智能搜索引擎在现存的搜索引擎系统增加基于知识表示的语义网络--知识库,通过系统与用户交互(人机交互),对用户最初输入的查询词进行精确定义,并给出基于知识的相关语义的词汇作为搜索输入词精确定义后的补充,从而使搜索在精确定义的基础上,按照知识的内容关联(基于知识相关性的语义网)进行全面搜索,并将搜索后的阶段性结果与知识库相对照进行筛选,最终给出以知识特征识别的搜索结果。系统还将专业的检索方法首次应用于搜索引擎,将搜索领域扩入到文本检索以外,进行文献目录检索,包括专利、国家标准、图书馆图书的检索,在用户选定文献目录种类后,经由搜索引擎的知识库判别,再由搜索引擎直接完成目录搜索(用户不必经过搜索引擎之后再访问专利、国家标准、图书馆等体育专业文献的检索系统,而由搜索引擎一次完成)。目前,搜索引擎的流程和体系结构设计已经完成。合作方式:面议。
全学科、全行业智能搜索引擎应用系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该系统由三部分组成:1.搜索引擎:它是该应用系统的核心部分。它有“网络信息主题分类体系”标准(待批国家标准)作为网络信息组织的基础和网络信息查询的大型词表库的支撑,可从16种信息类型、135个行业、8种信息载体快速实现信息三维定位查询;支持目录式搜索和索引式搜索;支持超文本、超媒体搜索方式;同时支持自然语言和受控语言的检索方式;支持同义词联动检索、全文检索、字段检索、组合检索、逐级逼近检索、定题检索服务。2.基于网络环境的中文信息自动标引系统:该系统能对网络爬虫软件从网上自动提取的信息或WEB浏览器输入的批量信息,由计算机自动赋予分类检索标识和主题检索标识,在统一标准的基础上完成网络信息的自动分类标引、主题标引和类目词标引。3.全学科、全行业网络信息分类主题词表及其管理系统:通过科技术语的标准化、信息交流的规范化,实现对全行业、全学科(19个门类、135个行业、学科)的知识信息、工程信息、产品信息进行标准化、规范化、有序化组织,从而达到信息准确的加工、通畅的交流和有效的共享。
基于动态贝叶斯模型的网页垃圾检测方法
成熟度:正在研发
技术类型:发明
应用行业:制造业
技术简介
基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。
网络文摘定制搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该网络平台实现基于搜索引擎、互联网、移动通信、存储管理、智能识别等技术开发的一种新型网络空间,适合大、中、小企业和个人互联网用户。 创新的理念是:在为信息搜索者提供专有空间的同时,使用智能搜索引擎,将用户设定的信息需求准确、及时、自动的存放到自有个性空间,为用户提供及时、方便和安全的信息文摘平台。 调查显示,70%以上的用户通过搜索引擎找到相关的内容。据2006年3月CNNIC的调查数据,中国内地的网民数量达到1.2亿,由此可以看出,搜索引擎已经成为一个实实在在的信息枢纽和信息门户,成为用户获取网络信息的首选工具。 经过10年的市场培养,搜索引擎营销在中国已经收到了普遍的认可。计世资讯(CCW Research)最新的研究报告预计,2006年中国的搜索引擎市场总额将突破20亿元大关,并实现46%左右的增长。计世资讯(CCW Research)认为,中国互联网市场上存在的搜索引擎企业形成了三层梯队:第一层梯队是Google、百度、Yahoo;第二层梯队是中搜、新浪、搜狐、网易;第三层梯队是正在兴起的专业搜索。搜索引擎从一个默默无闻的网络工具在10多年内迅速窜升成为互联网上仅次于邮件的第二大应用,并成为今天的投资人最感兴趣的技术之一,其直接诱因是互联网内容的爆炸式增长。 资料显示,1994年7月在卡内基梅隆大学诞生的第一个真正意义的互联网搜索引擎Lycos,其最初收录索引的只有5.4万个网页,到今天全球影响力最大的搜索引擎Google收录索引已超过80亿个网页,运行搜索引擎从最初的单台服务器到数以几十万计的服务器,依然跟不上互联网信息资源的增长速度,而且毫无疑问,今天的内容正在以前所未有的速度递增,这给我们进行内容的收集和整理带来了很大挑战。 搜索引擎的价值在于将传统的静态环境下的信息检索技术转移到动态、实时的网络环境中,并应用到互联网、外联网和企业内网的信息资源管理和信息利用中去,通过搜索引擎感知企业外部经营环境,进行信息资源开发、管理和利用,进而塑造企业竞争优势。今天,全球化和网络化对企业信息和知识资产的加工共享已经不只局限在提高生产率、有效整合企业资源、降低运营成本这些短期收益方面,更重要的是它已经涉及到企业的核心竞争力、生存力和综合实力的长远问题,已成为流淌在企业生产经营活动中的一种血液,成为另一种无形的生产要素。 在搜索引擎的发展方向上,一方面是追求质量,另一方面是扩展应用。人们对质量的追求总是无穷无尽的,新的搜索引擎技术将会“更准”—更加智能化、结果更让人满意;“更全”—数据容量更大,找到的信息更全;“更快”—查询速度快,内容更新快;“更大”—数据容量更大。扩展应用的关键在于发掘需求、细分需求,满足人的各个方面的需求,例如各种多媒体的专向搜索、各种专业的垂直搜索都会有广阔的市场。 网络文摘定制搜索引擎及时把人们从繁忙中解脱出来,根据人们的需要,在所关注的网站上搜索信息,减少了网民在网上查找资料消耗的时间,及时把相关信息查找出来,极大的提升效率,经验证明:相关主题在行业网站上出现的几率最大,行业网站基本包括了最新成果的相关信息。网络文摘定制搜索引擎作为专业化、个性化的搜索引擎服务将得到极为快速的发展,培育并影响着个人用户进行信息消费的习惯。 它以用户为中心实现了搜索引擎服务从网络信息导航向网络信息服务转变,形成新型信息增值服务的巨大市场空间。 新一轮的搜索技术竞争将在智能化和个性化领域展开,网络文摘定制搜索引擎将会有一个美好的未来。
找到17项技术成果数据。
找技术 >专利数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的专利数据库的搜索方法,一般是用专利名称或关键词的搜索方法,这些方法有众多不便之处。 一种专利数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”设置到的,会在“数据搜索”中出现该分类名称及其信息;没有设置到的,将不会在“数据搜索”中出现该分类名称及其信息。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
面向用户在线学习的多媒体检索系统
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
面向用户在线学习的多媒体检索系统。 本系统采用多媒体计算技术、机器学习技术、模糊映射技术,开发基于内容的多媒体搜索引擎。采用.Net 平台开发基于B/S架构的数字媒体管理系统。系统架构如图1所示。 系统特点: 1. 多媒体搜索引擎能够根据用户的偏好,具有自我在线学习能力,用户能够与系统进行交互,以改善系统检索的准确率。图1 在线学习的多媒体检索系统Figure 1 Multimedia Retrieval System Based on Online Learning 2. 检索算法先进,在保证查全的前提下,具有检索准确率最大化的控制特性。 3. 检索速度快,需要的存储空间小,适合海量多媒体数据库的管理,对新出现的媒体内容,可以采用增量的方式,加载进数据库中。 系统功能: 本系统是针对多媒体的信息化管理设计的,其主要功能如下: 1. 搜索引擎可以适应各种类型的不同格式的多媒体内容检索需求。 2. 能够根据用户的喜好,进行在线学习,使检索的准确率最大化。 3. 通过关键字、素描、多媒体内容,用户可以查询任意一种多媒体数据。 主要技术指标: (1)检索时间:≤2 秒; (2)检索准确率:≥90%; (3)检索查全率:≥95%;
天眼查基于知识图谱的搜索引擎技术及产品
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
天眼查基于知识图谱的搜索引擎技术及产品成果在基于对行业技术状况进行深入调研的基础上,严格遵循《中华人民共和国数据安全法》、《中华人民共和国网络安全法》的基础上,重点分析公开数据分布广泛,不易整合的因素,找到核心技术难点,制定相应技术方案,解决相关问题。 形成全数据集成平台模块,解决数据收集,主要包括数据集成平台和数据收集平台,自动收集框架集成到本研究系统中,新建各种数据自动收集任务,收集互联网相关数据。 形成数据预处理平台模块对经济领域所涉及的各种文本通用处理操作的集成,主要包括 NLP 预处理和词向量预处理。 形成数据标注平台模块解决数据标注对经济领域自动标注算法实现功能展示。 研发知识抽取平台模块建设生成关系抽取器,结合系统其他功能模块,实现对一个句子文本中实体关系三元组的抽取功能。 实现知识图谱可视化平台将构建的经济领域知识图谱以图形式呈现给用户,方便用户观察,通过知识图谱可视化平台进行可视化呈现。
智能搜索引擎关键技术及产业化
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
搜索引擎是获取互联网信息的最重要入口,拥有自主可控的搜索引擎是国家重大战略需求。在智能移动设备迅速普及、人工智能技术快速发展的时代背景下,用户期望以自然语言表达、直接获取正确答案,基于关键词的传统搜索引擎已不能满足便捷、高效、精准地获取信息的需求。面对复杂多样的自然语言查询和浩如烟海的互联网数据,深刻理解需求、精准给出答案成为搜索领域世界公认难题。创新地融合知识图谱及深度学习技术,研发深刻理解意图、精准呈现结果、自然便捷交互的智能搜索引擎,是解决公认难题的必由之路。正是搜索引擎的智能化,造就了百度中文搜索引擎与时俱进,继续成为亿万网民获取信息的最主要入口。该项目在大规模知识图谱、基于深度语义分析的需求理解、基于深度学习的搜索排序、语音交互等方面取得重大突破,研发了自主可控的智能搜索引擎,占据了该领域的技术制高点。核心创新点如下:提出了大规模中文知识图谱构建及计算技术。突破了传统知识获取规模小、成本高、效率低的瓶颈。构建了全球最大的中文知识图谱,在知识图谱规模、图谱数据容量及检索性能等指标上达到国际领先水平。提出了基于知识图谱和深度语义分析的需求理解模型,实现对用户直接意图的精准识别、动态预测以及潜在意图的提前发现和主动推荐。意图识别准确率达95%,动态预测提升搜索效率10倍,并为85%的查询主动推荐相关结果。提出了基于深度学习的搜索排序算法,结合深度问答技术,突破了语义相关性弱、搜索结果不直观的瓶颈。在国际上首次将深度学习应用于搜索引擎,搜索结果准确率达85%,每日为超过2亿条查询直接提供正确答案。提出了语音、语言、搜索一体优化的语音搜索技术。解决了口语化查询识别和理解准确率低、自然网页难以直接播报的难题。百度深度学习语音识别入选《麻省理工评论》2016年“十大突破技术”。每天响应超过6亿次语音请求,为用户提供了更为便利的体验,并惠及盲人、老人、儿童等群体。上述成果申请发明专利401项,已获授权205项,其中国际授权发明专利12项,在ACL、SIGIR、AAAI等领域顶级会议发表论文103篇。成果被院士专家鉴定为在中文搜索领域及知识图谱规模、图谱数据容量及检索性能、中文智能问答覆盖率及准确率等多项指标上“达到国际领先水平”。百度智能搜索产品,拥有6亿多用户,日均响应搜索约60亿次。多次获得习近平总书记、李克强总理等国家领导人称赞,全国人大常委会原副委员长、中国科学院原院长路甬祥院士在视察智能搜索成果时称赞百度是“新时代的民族英雄”。从2015年1月到2017年6月,取得直接经济效益170.56亿元,通过服务百度集团实现间接经济效益1062.06亿元。项目成果还服务了超过100万家企事业单位,带动相关产业经济效益5.3万亿元。成果曾分别获2013年和2017年中国电子学会科学技术奖一等奖。
移动美食搜索引擎系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
课题来源与背景:搜索美食引擎必须有用户行为分析功能,能够记录用户的搜索历史,进而得出用户的喜好模型,给用户提供更加贴近需求的搜索结果。人们通常只是通过少量关键词与检索系统进行沟通,检索系统往往不能比较准确地返回用户所真正需求的信息。因此,进行搜索美食引擎的用户行为分析是非常必要的。研究目的与意义:当前互联网搜索的主要盈利模式是“竞价排名”能够对搜索结果进行适配,更好的在用户的手机上展示。适配包括文字长短裁减,媒体格式适配等。和“广告位购买”,手机搜索是从互联网模式发展起来的,因此不妨借鉴互联网搜索的盈利模式。主要论点与论据移动搜索是一个很有发展前景的业务,国内外移引擎公司合作。搜索美食引擎公司也有从互联网搜索扩展到移动搜索的强劲动力。创见与创新:内容具有成本,这些信息必须经过收集整理,并时常更新。运营商不可能免费获得这些信息,很可能要从专业的机构或者cP/SP购买,要付出一定的成本。因此对于本地信息,出于成本的考虑,运营商有收费的需求;而由于可以给出精确的搜索结果,本地搜索也有收费的可能。另外,搜索美食引擎必须支持自然语句搜索并对搜索请求进行语义分析,给出更加符合用户要求的结果。展现适配不同的手机性能和功能是一样的,搜索美食引擎应该具有适配性。社会经济效益,存在的问题:移动搜索业务之所以受到越来越多的关注,一方竞价排名是搜索美食引擎关键词广告的一种形式,按照付费最高者排名靠前的原则,对购买了同一关键词的网站进行排名的一种方式。竞价排名一般采取按点击收费的方式。竞价排名是搜索美食引擎公司的主要收益来源。广告位购买是在搜索美食引擎的主页和返回搜索结果页面的固定位置,设置广告位,由广告主来购买。对广告主客户来讲,手机搜索的广告比互联网搜索的广告更具吸引力。众所周知,手机广告因其具有传统媒介无可比拟的优势,即分众,定向,及时,互动,传播而成为最受广告界关注的“第五媒体”。手机媒体的互动性使广告信息传递的速度和广告质量有更大提高,新技术应用有助于用户行为的记录和评估,用户数据库的数据更为精确,定向和定位技术的普及使得能对广告受众进行细致而准确的分类,即提高目标受众覆盖率,也降低成本。经过顾客的许可,广告商可以收集非常有价值的用户信息以及行为信息作为市场营销目的,手机广告已经从简单的SMS广告发展到比较复杂的多媒体广告。而手机广告一旦和手机搜索结合,就会产生更大的效益。因为手机搜过的广告更具针对性,广告的效率更高。首先当用户使用手机搜索某个关键词,一定是他的需求非常急迫,否则可能会借助互联网工具搜索;其次由于手机搜索不能象互联网搜索那样给用户推送海量的搜索结果,因此借助手机搜索推出的广告面是它给普通用户带来了方便,另一方面是因为它潜在的盈利可能。
图书数据库的搜索引擎方法
成熟度:可规模生产
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
现有的图书数据库的搜索方法,一般是用书名或关键词的搜索方法,这些方法有众多不便之处。 一种图书数据库的搜索引擎方法,其特点: (1)提出一种“系统分类”较好地显示方法,即:点击第一级的其中一个分类名称,将显示其属下的第二级……至最后一级,这样不论在“数据输入”还是在“数据搜索”时,均一目了然,使用方便。 (2)在“数据输入”中发布信息后的“类型设置”没有设置到的,将不会在“数据搜索”中出现该分类名称,方便、明显地展示已经发布的信息分类。 (3)在上述的基础上,实现既可搜索一个类型的数据,也可搜索二个以上(含两个)的数据。数据库的类型分类,按照“图书分类法”、“出版社”,单独或两者结合起来,这样即可搜索出图书的“图书名、作者、图书简介、联系方式”等。 请进入“中国知识产权局”网站,在“申请(专利权)人”一栏里输入我的名字“张康德”,还可看到我申请的众多专利,您若对哪一项专利感兴趣,再与我联系。 另外,我还发表了专利方面的学术论文:“失效专利探讨”、“专利十日谈”、 “探讨两种专利技术转让模式”、“ 如何正确对待专利及技术转让”。(只要你将文章名输入网址,即可看到这些文章内容。这是我在刊物上发表,网民们看到后转载到网上的。)
体育产业专业智能搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
体育专业搜索引擎与因特网上普通的搜索引擎相比,特点和作用有两个:第一,它是智能化的,对于体育领域信息搜索的效率和相关性大大提高,特别是针对体育科研的搜索效率会大大提高;它能够按照用户的偏好,跟踪、和定位并定期搜集前沿体育科研文献和信息;第二,它是专业化的,面向体育的生产、服务单位的信息服务企业可以购买该搜索引擎进行体育信息服务。使用该搜索引擎的机构可以通过为体育设施、设备生产商和体育场馆开放服务发布信息而赢利,而该搜索引擎的开发商可以通过销售该搜索引擎软件而盈利并扩大影响。应用说明:体育专业因特网智能搜索引擎在现存的搜索引擎系统增加基于知识表示的语义网络--知识库,通过系统与用户交互(人机交互),对用户最初输入的查询词进行精确定义,并给出基于知识的相关语义的词汇作为搜索输入词精确定义后的补充,从而使搜索在精确定义的基础上,按照知识的内容关联(基于知识相关性的语义网)进行全面搜索,并将搜索后的阶段性结果与知识库相对照进行筛选,最终给出以知识特征识别的搜索结果。系统还将专业的检索方法首次应用于搜索引擎,将搜索领域扩入到文本检索以外,进行文献目录检索,包括专利、国家标准、图书馆图书的检索,在用户选定文献目录种类后,经由搜索引擎的知识库判别,再由搜索引擎直接完成目录搜索(用户不必经过搜索引擎之后再访问专利、国家标准、图书馆等体育专业文献的检索系统,而由搜索引擎一次完成)。目前,搜索引擎的流程和体系结构设计已经完成。合作方式:面议。
全学科、全行业智能搜索引擎应用系统
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该系统由三部分组成:1.搜索引擎:它是该应用系统的核心部分。它有“网络信息主题分类体系”标准(待批国家标准)作为网络信息组织的基础和网络信息查询的大型词表库的支撑,可从16种信息类型、135个行业、8种信息载体快速实现信息三维定位查询;支持目录式搜索和索引式搜索;支持超文本、超媒体搜索方式;同时支持自然语言和受控语言的检索方式;支持同义词联动检索、全文检索、字段检索、组合检索、逐级逼近检索、定题检索服务。2.基于网络环境的中文信息自动标引系统:该系统能对网络爬虫软件从网上自动提取的信息或WEB浏览器输入的批量信息,由计算机自动赋予分类检索标识和主题检索标识,在统一标准的基础上完成网络信息的自动分类标引、主题标引和类目词标引。3.全学科、全行业网络信息分类主题词表及其管理系统:通过科技术语的标准化、信息交流的规范化,实现对全行业、全学科(19个门类、135个行业、学科)的知识信息、工程信息、产品信息进行标准化、规范化、有序化组织,从而达到信息准确的加工、通畅的交流和有效的共享。
基于动态贝叶斯模型的网页垃圾检测方法
成熟度:正在研发
技术类型:发明
应用行业:制造业
技术简介
基于动态贝叶斯模型的网页垃圾检测方法涉及一种作弊网页检测的方法,主要采用一种改进的动态贝叶斯网络模型为用户点击行为建模,对作弊网页进行判断和识别,搜索引擎查询日志记录了用户与搜索引擎的交互信息。它的内容包括查询词、搜索引擎返回的网址、用户点击的网址以及时间戳等信息。日志中被点击的网址及其点击顺序等信息反映了用户的喜好。本发明为日志点击行为建模,挖掘搜索引擎返回列表序列中网址之间的点击因果关系,从用户的角度说明了哪些网址是用户认为和查询词相关联的,得到从用户角度出发的网页与查询的相关性,它是一种隐含的回馈,从而使作弊网页的排名位置靠后,而相关网页的排名则靠前了。
网络文摘定制搜索引擎
成熟度:-
技术类型:-
应用行业:信息传输、软件和信息技术服务业
技术简介
该网络平台实现基于搜索引擎、互联网、移动通信、存储管理、智能识别等技术开发的一种新型网络空间,适合大、中、小企业和个人互联网用户。 创新的理念是:在为信息搜索者提供专有空间的同时,使用智能搜索引擎,将用户设定的信息需求准确、及时、自动的存放到自有个性空间,为用户提供及时、方便和安全的信息文摘平台。 调查显示,70%以上的用户通过搜索引擎找到相关的内容。据2006年3月CNNIC的调查数据,中国内地的网民数量达到1.2亿,由此可以看出,搜索引擎已经成为一个实实在在的信息枢纽和信息门户,成为用户获取网络信息的首选工具。 经过10年的市场培养,搜索引擎营销在中国已经收到了普遍的认可。计世资讯(CCW Research)最新的研究报告预计,2006年中国的搜索引擎市场总额将突破20亿元大关,并实现46%左右的增长。计世资讯(CCW Research)认为,中国互联网市场上存在的搜索引擎企业形成了三层梯队:第一层梯队是Google、百度、Yahoo;第二层梯队是中搜、新浪、搜狐、网易;第三层梯队是正在兴起的专业搜索。搜索引擎从一个默默无闻的网络工具在10多年内迅速窜升成为互联网上仅次于邮件的第二大应用,并成为今天的投资人最感兴趣的技术之一,其直接诱因是互联网内容的爆炸式增长。 资料显示,1994年7月在卡内基梅隆大学诞生的第一个真正意义的互联网搜索引擎Lycos,其最初收录索引的只有5.4万个网页,到今天全球影响力最大的搜索引擎Google收录索引已超过80亿个网页,运行搜索引擎从最初的单台服务器到数以几十万计的服务器,依然跟不上互联网信息资源的增长速度,而且毫无疑问,今天的内容正在以前所未有的速度递增,这给我们进行内容的收集和整理带来了很大挑战。 搜索引擎的价值在于将传统的静态环境下的信息检索技术转移到动态、实时的网络环境中,并应用到互联网、外联网和企业内网的信息资源管理和信息利用中去,通过搜索引擎感知企业外部经营环境,进行信息资源开发、管理和利用,进而塑造企业竞争优势。今天,全球化和网络化对企业信息和知识资产的加工共享已经不只局限在提高生产率、有效整合企业资源、降低运营成本这些短期收益方面,更重要的是它已经涉及到企业的核心竞争力、生存力和综合实力的长远问题,已成为流淌在企业生产经营活动中的一种血液,成为另一种无形的生产要素。 在搜索引擎的发展方向上,一方面是追求质量,另一方面是扩展应用。人们对质量的追求总是无穷无尽的,新的搜索引擎技术将会“更准”—更加智能化、结果更让人满意;“更全”—数据容量更大,找到的信息更全;“更快”—查询速度快,内容更新快;“更大”—数据容量更大。扩展应用的关键在于发掘需求、细分需求,满足人的各个方面的需求,例如各种多媒体的专向搜索、各种专业的垂直搜索都会有广阔的市场。 网络文摘定制搜索引擎及时把人们从繁忙中解脱出来,根据人们的需要,在所关注的网站上搜索信息,减少了网民在网上查找资料消耗的时间,及时把相关信息查找出来,极大的提升效率,经验证明:相关主题在行业网站上出现的几率最大,行业网站基本包括了最新成果的相关信息。网络文摘定制搜索引擎作为专业化、个性化的搜索引擎服务将得到极为快速的发展,培育并影响着个人用户进行信息消费的习惯。 它以用户为中心实现了搜索引擎服务从网络信息导航向网络信息服务转变,形成新型信息增值服务的巨大市场空间。 新一轮的搜索技术竞争将在智能化和个性化领域展开,网络文摘定制搜索引擎将会有一个美好的未来。