10大AI搜索终极比拼,谁最强?超详细评测

微凉的衣柜 2024-08-05 12:31:01 阅读 98

在人工智能领域,AI搜索引擎的竞争愈发激烈。随着Perplexity等新兴搜索引擎的崛起,传统搜索引擎如谷歌面临前所未有的挑战。国内市场同样热闹非凡,各大科技公司纷纷推出自家的AI搜索产品。本文将对Perplexity、秘塔、百小应、360AI、天工、Thinkany、GPT-4o等10款AI搜索引擎进行全面评测,分析它们的优劣,帮助大家选择最适合自己的AI搜索工具。

引言

AI搜索引擎作为互联网信息获取的重要工具,其发展潜力巨大。通过大模型和智能算法,这些工具能够更精准地回答用户的问题。本文将通过实测四个具有代表性的问题,对各大AI搜索引擎的表现进行评分,并最终评选出最强的AI搜索工具。

测试方法

为了全面评估各AI搜索引擎的性能,我们设计了以下测试方法:

时效性问题:考察AI搜索工具能否检索到最新的信息。复杂性问题:需要多源信息检索,考察AI的综合信息处理能力。容错能力:在问题中添加错误信息,考察AI能否主动纠正。详细性问题:考察AI能否提供详细而准确的答案。

每个问题根据AI搜索工具的回答进行评分:正确答案记1分,部分正确记0.5分,错误答案记0分。

参赛选手

这次评测的AI搜索引擎包括两大类,共十个产品:

原生AI搜索引擎

Perplexity秘塔360AI天工AIThinkany

大模型厂商的AI搜索功能

ChatGPTKIMI百小应腾讯元宝MiniMax的海螺AI

问题一:中国用户有哪些低门槛的方式开通ChatGPT Plus会员?

测试结果

Perplexity:答案准确且全面,得分1分。秘塔:拒绝回答,得分0分。360AI:部分正确,但不全,得分0.5分。天工AI:答案部分正确,得分0.5分。Thinkany:回答不完整,得分0.5分。ChatGPT:部分正确,得分0.5分。KIMI:答案部分重复,得分0.5分。百小应:答案完整,得分1分。腾讯元宝:部分正确,得分0.5分。MiniMax的海螺AI:答非所问,得分0分。

问题二:GPT-5的上下文长度是200K吗?

测试结果

Perplexity:没有指出GPT-5未发布,得分0.5分。秘塔:同样没有指出GPT-5未发布,得分0.5分。360AI:未指出GPT-5未发布,得分0.5分。天工AI:未指出GPT-5未发布,得分0.5分。Thinkany:指出GPT-5未发布,得分1分。ChatGPT:指出GPT-5未发布,得分1分。KIMI:直接将错就错,得分0分。百小应:指出GPT-5未发布,得分1分。腾讯元宝:答案错误,得分0分。MiniMax的海螺AI:指出GPT-5未发布,得分1分。

问题三:按先后顺序排列以下大模型的发布时间,并标记具体时间

测试结果

Perplexity:大部分答案错误,得分0分。秘塔:答案正确,得分1分。360AI:部分答案正确,得分0.5分。天工AI:大部分答案错误,得分0分。Thinkany:大部分答案错误,得分0分。ChatGPT:大部分答案错误,得分0分。KIMI:部分答案正确,得分0.5分。百小应:部分答案正确,得分0.5分。腾讯元宝:大部分答案错误,得分0分。MiniMax的海螺AI:部分答案正确,得分0.5分。

最终评分

百小应:3.5分Perplexity:3分ChatGPT:3分秘塔:2分Thinkany:2分KIMI:2分360AI:1.5分天工AI:1.5分腾讯元宝:1分MiniMax的海螺AI:1分

总结与展望

在本次AI搜索引擎的评测中,百小应以3.5分的成绩荣获第一。Perplexity和ChatGPT紧随其后,各得3分。秘塔、Thinkany和KIMI表现中规中矩,而360AI、天工AI、腾讯元宝和MiniMax的海螺AI则有较大的改进空间。

AI搜索引擎的实用性已经显现,但也存在一些无法避免的问题,如对网络上的梗和反讽内容的识别能力不足,以及出现幻觉的现象。未来,随着技术的不断发展,这些问题有望得到进一步改善,为用户提供更加精准和可靠的信息服务。



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。