加入收藏 | 设为首页 | 会员中心 | 我要投稿 应用网_镇江站长网 (https://www.0511zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 传媒 > 正文

基础技术应用广 百度主题研究项目成果多

发布时间:2014-01-16 01:58:13 所属栏目:传媒 来源:站长网
导读:熟悉百度搜索的人会发现,自百度提出知心搜索后,百度搜索结果展示页面发生了巨大的变化,其中变化较大的就是页面的右侧。相比往昔,百度搜索结果展示页面的右侧增加了“其

熟悉百度搜索的人会发现,自百度提出知心搜索后,百度搜索结果展示页面发生了巨大的变化,其中变化较大的就是页面的右侧。相比往昔,百度搜索结果展示页面的右侧增加了“其他人还搜”等多个栏目,更加方便网民浏览和获取信息。这些变化或大或小,但是它们的实现,均离不开技术的进步。

“做这个项目的意义在于,总结并抽象了多个产品线背后的本质需求,梳理并调研了多项相关基础技术,构建了一套较完善的自动挖掘系统,可以服务于更多的产品,避免了各部门在同一技术上的重复人力投入。”百度互联网数据研发部资深研发工程师牛正雨表示。

牛正雨所指的项目是“互联网图片的自动文本标注”,这个项目是百度第二届开放研究计划之IT主题项目研究的主要课题之一,由百度互联网数据研发部和南京大学共同承担。

“项目定位是为互联网图片自动赋予语义关联的实体、关键词以及一段描述文本,通俗地讲,就是给图片打标签,让计算机能和人一样理解图片内容。我们已经开发了一套较完善的自动挖掘系统,这套系统融合了图片视觉内容信息、图片所在页面的周边文本信息等多个信息源,可以在海量图片数据上自动挖掘出图片的标签与描述文本。”作为“互联网图片的自动文本标注”项目的主要负责人,牛正雨对项目内容和项目成果都非常了解。

牛正雨表示,该项目的主要创新点是通过考虑图片所在网页信息来提升图片和标签或文本的关联准确率,前人工作集中于基于图片视觉内容进行图片与标签的语义关联计算。另外,牛正雨还透露,该项目中南京大学计算机系机器学习实验室的年素磊同学,在项目开展期间作为实习生在百度参与项目研究工作,由于他工作成果突出,已经被百度互联网数据研发部录用,即将成为百度的正式员工。

据了解,该项目的主要技术成果已经被应用于百度大搜索的知心实体配图,image产品线阿凡达项目和网盟图片广告等。据牛正雨介绍,所谓大搜索的知心实体配图,是基于图片的实体标注数据,通过一系列技术手段为实体挖掘高质量配图。图文并茂的展现方式,极大提升了用户的搜索体验。例如,在百度中搜索“林志颖”,搜索页面右侧中展现的“其他人还搜”中还推荐了“陈若仪”、“方舟子”、“林心如”和“罗志祥”的信息,这些信息的展现形式是人物名字及其对应的图片,名字和图片能够一一对应,就是 “互联网图片的自动文本标注”项目技术成果的应用。

image产品线阿凡达项目是针对百度图片的一项优化,阿凡达项目定位于高质量图片数据的挖掘与特型展现,在多个垂直类目中,已经基于图片的自动标注结果,挖掘出大量高质量图片数据。实验结果同样显示,采用了该项技术后,图片检索效果取得了大幅度提升,核心流量指标也随之大幅上涨。

另一个应用点是网盟图片广告,它是在百度图片image搜索结果中以浮层方式展现广告。例如,在百度图片中搜索“htc手机”,在搜索结果页中,则会显示国美在线相应的图片广告。它的实现也使用了图片自动标注技术。

“在做这个项目之前,百度各个产品线都有类似的需求,即为图片自动标示出实体或关键词信息,但是大家的技术积累普遍偏弱。我们这个项目开发的自动挖掘系统,解决了这个技术难题,同时也避免了各产品线在技术上的重复投入。各产品线可以直接应用这套系统提供的服务,大大提高了工作效率。”牛正雨认为,“互联网图片的自动文本标注”的项目成果应用前景非常广阔,对百度各产品线均有裨益。

(编辑:应用网_镇江站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读