推广 热搜: 未来    中国  企业  服务  政策  公司  快速  上海  设备 

实测国内排名第一的AI搜索,刷新了我的认知

   日期:2024-11-01     作者:caijiyuan    caijiyuan   评论:0    移动:http://lzlz0618.dbeile.cn/news/249.html
核心提示:AI搜索我们过去写过十问AI搜索,这是由大量的AI搜索从业者闭门会后共同得出的小范围共识,其中一些结论,很快就在百度出手AI搜索

AI搜索我们过去写过十问AI搜索,这是由大量的AI搜索从业者闭门会后共同得出的小范围共识,其中一些结论,很快就在百度出手AI搜索后得到验证,包括:

实测国内排名第一的AI搜索,刷新了我的认知

除此之外,从百度AI搜索我也得到了一些新的触动,比如多模态交互的重要性、AI搜索核心还是解决用户的需求,快捷的一站式解决方案是一个很重要的点等等。


今天我们从百度的一些动作来挨个看一看,然后我会具体就前面说的几个要点,进一步给大家展开:

我们都知道国内搜索当之无愧的霸主是百度,这次Ai智能回答一项功能上榜直接就锁定第一,并且访问量等于后几名之和,天啦噜,大家才开始惊呼:原来AI搜索真的是大厂囊中之物?!

百度的AI搜索,基于过去多年积累的海量数据,在AI智能回答的体验上很惊艳,我们来看几个Case:

我们来试一下Query:“在河之洲上一句”:

这是一个挺常用的Query,很容易看得出大家的区别:


首先呢,输入在河之洲,关联词就已经出现了“在河之洲上一句”,用户只需要点击一下,不用再输入剩下的三个字,这个是天工和秘塔没有办法做到的。


百度有丰富数据积累的能力就展示出来了,在意图识别和对应的响应上,能不能快速补齐Query、能不能有多样化的工具满足用户的需求,这可不是创业公司短时间可以追上的。

语音大模型的三段式是什么来着?ASR,,还有一个是啥”,百度的AI智能回答在第一句话就标粗直接给到了标准答案,省去了我翻看的时间。并且让我惊奇的是,如果没有AI回答,下方最相关的一个链接还是2019年AI1.0时代的内容: 

这个问题,天工和秘塔AI搜索都出现了很明显的错误,甚至把我Query里明确写出的ASR和LLM都给“抹除掉了。。看了下智谱,答的没有问题,但是第一段绕了一大段,还把LLM非得说成LM又自己圆回来,费劲。。 

图片

有意思的是,天工和秘塔的答案一模一样,大概率是两家都用了Bing的搜索接口,并且没有做好搜索结果的重排序,导致这个case一起错了。。。没有搜索基础就是很容易出这种错误。

用户搜索其中一个诉求是希望获得答案,那如何更好的呈现答案,也很重要。我们看几个有意思的案例: 

图片

上左图是深蹲正确姿势,上右图是马卡龙色,百度可以很好的识别Query背后的意图,并给出不同的结果,深蹲姿势适合用视频对比,给了,马卡龙色适合用多图查看,给了!

除了视频和图片模态外,百度还能给出POI信息:

图片

比如“北京最大的游乐场叫什么名字”,可以看到答案的底部是一个地址信息,点击后打开了POI的详情页,接下来就可以很方便的看攻略、导航、打车这些了。

搜索是一个入口,后面可以是链接、信息、Agent,其中Agent作为深度服务的承载,也融入了百度产品体系内,比如:

新加坡旅游局有一个Agent,对应的非常多信息在搜索时都会调出来,这种时候能获得的答案维度就非常多。

图片

令人吃惊的是,连什么时候去新加坡人少,都可以获得真实的数据,最近是暑假肯定不能去,接下来9-11月人都会比较少。

然后我有更多的问题,点击新加坡旅游局Agent,都可以各种追问,相当方便啊!

我们看三个case:


这个是识万物,识万物是一个统一的入口,交互非常方便,首页点击拍照按钮,对准物品后保持1s左右,就会开始自动AI识别,给出答案后,还可以点搜索小框,继续追问,比如我问一般多少钱,还能接着给出回复。

另外我孩子的暑假练习每天都得批改,试了下发现识别率惊人,百度把批改也整合了进来,太方便了:

更夸张的是,病历都能解读了?

图片

这个是我从网上找的一个病历,给出的结论还是挺详细的,最后实在不放心还可以直接问真人医生。用我自己的也试了下,结果准确!


举几个Case:

图片

比如我在搜到一个图时,发现图片还挺模糊的(上左),然后点了一下“AI变清晰”,惊奇地发现,图片真的清晰了非常多(上右)

图片

再比如上左图,明显在模特身上还带有水印,轻轻地点一下AI去水印,惊奇的发现,自动去好了(上右图)!


在图片AI处理模块,除了上面两个能力外,百度做了非常多,我们在图片界面点击右下角“AI图片处理”按钮,就可以发现有很多,我们选一个AI扩图试试,就可以把一张横版的图片,扩成竖版,效果还是可以的: 

图片

 并且可以上传图片,也就是说,把它当成一个AI图片处理软件完全ok!

图片


比如这个我把最近很火的Character.ai两位创始人照片传上去,除了可以变成泥土风格外,还可以P出两人在宇宙的feel,笑死了。

图片

更多的好Agent,更好的和搜索结合,一定是下一步非常重要的AI搜索趋势。

语音输入作为一个看似标准的策略,百度也做出了很不一样的创新:

图片

除了识别准确率很高之外,还有很多隐藏小能力:

百度从2000年1月上线到现在,已经迈过了24年的时光,作为长期的国内搜索霸主,在数据积累上毋庸置疑,包括了海量的用户数据和搜索行为信息,前面的Case里我们能看到数据积累对AI搜索的重要性:

a) 快速的意图识别和查询补全

Case1里的"在河之洲上一句"的查询中,百度能够在用户输入"在河之洲"时就准确毫秒级预测出完整查询,这种精准的预测能力源自于大量用户历史搜索数据的分析。

这样不仅大幅提高了用户的输入效率,还能帮助用户更准确地表达搜索意图,减少了潜在的错误输入。

b) 丰富的垂直领域数据

百度汉语服务能在不到数百毫秒级的时间内直接给出"在河之洲"的下一句,无需调用大模型生成。

对于特定领域的查询,百度可以提供即时、准确的回答,大大提升了用户体验和搜索效率。

我个人一直认为满足用户的需求是目的,用不用AI那都是手段,没有人规定必须要用AI,老百姓也不懂不关心有没有AI。

我在使用过程中,也发现了很多有意思的案例:

图片

比如汉字的拼音和拼写顺序,比如对于一些答案还用了tab可以快速查看AI给出的总结选项。

之所以说是积累,就是AI很像是基于过去已有的数据做提炼呈现,如果你没有数据,那就巧妇难为无米之炊。

c) 准确的搜索结果排序

在Case2里,百度能够准确识别用户意图,并在回答中突出关键信息。天工和秘塔则均出现了错误,我也专门询问了一些从业者,为何这两家出现的错误还一模一样,告知我大概率是由于都使用了Bing的接口获得结果,再做总结整理。。。

如果别人给你的结果都是一样错误的,那LLM自然只能给出一样错误的答案。

所以对于用户意图、自建索引库,特别吃积累,你没有那就只能依赖于别人,这也是创业者很难在搜索赛道和大厂正面竞争的原因。

d) 多样化的数据类型

前面很多Case我们可以看到,百度能够处理文本、图像、语音等多种类型的查询,并提供相应的AI服务(如AI图片处理)。

这样可以全方位满足用户在不同场景下的搜索需求,提供一站式解决方案。那用户就没有必要再多下一个App,从而能留在百度里面,这种强问题解决能力,也需要过去多种类型数据的长期积累,并且有足够的AI能力来处理才能融会贯通。

数据积累的重要性不仅体现在数据量的大小,更体现在数据的质量、多样性等方面。

综上,百度通过多年的搜索服务积累了独特的数据优势,这些数据在AI搜索时代成为了不可替代的核心竞争力。它们支撑了更智能的查询理解、更精准的结果匹配、更丰富的垂直领域服务,以及更个性化的用户体验。这种基于海量数据的AI搜索能力,是新兴AI搜索公司短期内难以追赶的,也印证了"AI搜索最大的壁垒在于数据"这一观点。

多模态交互,这么多AI搜索里,百度是我第一次看到比较惊艳的产品,它有几个方面:

a) 语音交互:便捷的声音对话

语音唤醒:百度App支持"小度小度"语音唤醒功能,用户无需手动点击就能开始语音搜索,极大地提高了便利性。

指令识别:系统能够识别并执行各种语音指令,包括系统设置等功能,使得语音交互不仅限于搜索,还能控制设备。

智能对话:用户可以与特定的AI角色(如古人Agent)进行语音对话,这种拟人化的交互方式增加了趣味性和参与感。

b) 图像识别:视觉化的信息输入

"识万物"功能:用户只需拍照或上传图片,AI就能识别图中物体并提供相关信息。这极大地扩展了搜索的输入方式。

文字识别:能够自动识别并批改作业,大大提高了教育领域的效率。

医疗图像解读:系统甚至能解读病历,虽然仍需医生确认,但这显示了AI在专业领域应用的潜力。

c) 多模态输出:丰富的结果呈现

视频内容:对于需要动态展示的内容,如运动姿势,系统会优先选择视频形式,这比静态图片或文字描述更直观。

图片展示:对于视觉性强的查询,如颜色或设计相关的内容,系统会提供多张相关图片,便于用户直观比较。

POI信息整合:在提供位置相关信息时,系统不仅给出文字答案,还会附带地图、导航等POI(兴趣点)信息,方便用户进行后续操作。

而以上这些结果,百度会智能的匹配来选择。

d) 跨模态协同:无缝衔接的用户体验

图像到文字:Case4里,用户上传图片后,可以通过文字提问来获取更多关于图片内容的信息,实现视觉和语言的结合。

语音到图像:用户可以通过语音描述来搜索相关图片,系统能够理解语音内容并匹配相应的视觉信息。

不管是基于图片使用文字进行进一步查询,还是语音输入后用文字+图/视频输出,通过整合文本、语音、图像等多种模态,百度AI搜索创造了更自然、更直观、更高效的搜索体验。这种全方位的多模态交互不仅满足了不同场景下用户的多样化需求,还大大提升了信息获取的效率和准确性。

我也是研究了百度AI搜索后,才发现了多模态交互原来可以这么做,并且这么做是非常自然也符合用户使用习惯的!

Case3里,在搜索新加坡旅游相关信息时,系统会自动调用新加坡旅游局的官方Agent。

以及百度做了专门的Agent开发平台,相信随着优质Agent的增加,以及搜索更多的融合Agent,这个方向会大爆发:

百度⽂⼼智能体平台构建了丰富多元的智能体⽣态,早在今年5⽉份,我们的智能体数量已经超过了11万;截⽌今年7⽉,⽂⼼智能体平台已经吸引了20万开发者,拥有6.3万企业⼊驻; 

相较于通⽤的多轮交互,智能体更轻量、更专业,满⾜了更垂直、更细分的⽤户需求,我们的企业、机构合作伙伴,以及开发者也做出了许多优秀的智能体。

如果这部分跑通了,对于这个生态的繁荣我真的特别期待,因为大家都能赚到钱,消费者也能解决问题,一定是会越来越好!

前面讲的这几点,都会导向最后的这一点:一站式解决方案!

可以发现,“搜索”的商业模式是建立在“供需链接"上的,用户通过"搜索"这个动作来"表达需求",商家通过投放广告来对接到需求,进行"供给"。

以前的"搜索引擎",能"供给"的东西有限,网站信息是全部,可是今天...

需求从容易满足到较难满足是个光谱,从最基本的提供“信息”、到最复杂的提供"服务",而百度在逐渐尝试向后延展,这里包含两方面:

“Query”是用户需求的文字表达,一旦AI时代能对“Query”背后的用户意图有更好的理解,就可以做到对功能/能力的准确分发,并结合自己做+引入生态,共同解决好用户的需求。

当一站式就能满足用户需求时,不仅会改变用户的搜索习惯,还会重新定义搜索引擎的角色和功能。这种方案将搜索引擎从单纯的信息提供者转变为全方位的问题解决者,标志着搜索技术和用户体验的一次重大飞跃。

今年AI搜索逐渐变成了共识,随着百度这次在AI搜索领域的创新和突破,有个非常明确的趋势:

AI搜索不再仅仅是简单的关键词匹配和结果排序,而是演变成了一个智能、交互式、全方位的问题解决平台。

对于AI搜索的趋势我也重新梳理了一下,会有这么几个大趋势:

本文地址:http://www.dbeile.cn/news/249.html    多贝乐 http://www.dbeile.cn/ , 查看更多
 
标签: 排名第
 
更多>同类行业资讯
0相关评论

新闻列表
企业新闻
推荐企业新闻
推荐图文
推荐行业资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2023001713号