文心一言初体验,和ChatGPT语言理解能力比较

news/2025/2/22 14:35:52

文章目录

    • 第一个考验,语义理解
    • 第二个考验,历史问题的回答
    • 推荐阅读

百度旗下AI大模型文心一言宣布向全社会全面开放,所有用户都可以体验这款AI大模型了。要比较这两个语言模型,我们先设计好题目。

第一个考验,语义理解

题目1:如果我给你一个题目,你可以帮我用python实现它吗?我的题目是如何用一行代码实现九九乘法口诀表。
题目2:请根据这行python代码,提供完整的可以执行的代码。

重点是让语言模型能否根据第一个题目给出来的代码,接着编写完整的代码。

首先看文心一言的表现
在这里插入图片描述
从回复上看,完全没理解到语义,回复要求提供代码。

再来看看chatGPT的表现
在这里插入图片描述
我们暂且先不论答案的准确性或者准确度,单从语义理解角度看,chatGPT能根据上文问题,理解到下一个问题想表达的意思。这块上面,文心一言略有欠缺。
PS:chatGPT是3.5版本的模型

第二个考验,历史问题的回答

在不考就真实性的前提下,根据两个语言模型的回答,作为旁观者客观比较。
首先还是看文心一言的表现
在这里插入图片描述

再来看看chatGPT的回答
在这里插入图片描述
我个人觉得chatGPT的回答更加中性、委婉一些,条理性更清晰,也更加的客观一些。

当然,每个人的理解、认知不一样。但是从这两次比较来看,文心一言还需要再继续努力,相较来说,chatGPT更胜一筹。

推荐阅读

  • 多模态技术加持 更惊艳的GPT-4面世

http://www.niftyadmin.cn/n/4992813.html

相关文章

【多线程】lock与synchronized的区别

相同点: 1、他们都是Java中用于解决线程安全的工具,两者的性能相差不大 不同点: 1、在实现上synchronized引入了偏向锁、轻量级锁、重量级锁、锁升级来优化加锁的性能,而lock则使用自旋锁来实现性能的优化 2、synchronized是J…

VM装MACos

准备工具: 下载macOS Ventura 13 ISO镜像文件、VMware Workstation Pro最新版并激活(自行官网下载即可,需要镜像和key可以最下边的云盘自取) 下载Unlocker for VMware Workstation Pro,该工具用于解锁 macOS 系统支持、目前已支持macOS 13。 有需要的部分工具我放到最后 …

Java基础二十三(枚举)

1> 枚举 在 Java 中,枚举(Enum)是一种特殊的数据类型,用于定义一组命名的常量。枚举常用于表示一组相关的常量,并且可以增加额外的属性和方法。 在 Java 中,枚举是一种类,可以定义成员变量和…

测试用例编写规范参考

章节目录: 一、规范目的二、模块划分三、颗粒度规范四、编写规范五、具体分项5.1 用例标题5.2 前置条件5.3 操作步骤5.4 预期结果 六、用例维护七、结束语 一、规范目的 规范合理,可执行性。一定要保证高可读性。 二、模块划分 同级别、同等级功能点。…

iPhone 14 Plus与iPhone 14 Pro:你应该买哪一款

又到了iPhone季,这意味着你可能会在几种不同的机型之间左右为难,无法决定买哪一款。更令人困惑的是,苹果推出的iPhone变体——iPhone 14 Plus,只比老款iPhone 14 Pro低100美元。 有这么多选择,你可能想知道哪款iPhone最适合你。你应该买一部大屏幕的iPhone 14 Plus并节省…

el-date-picker自定义只能选中当前月份和半年内月份等

需求:el-date-picker只能选中当前月期和当前月期往前半年,其他时间就禁用了不让选择了,因为没数据哈哈。当然也可以选择往前一年等。 一、效果 二、写个日期选择器 :picker-options:日期选项 value-format:选择后的格…

正中优配:炒股软件自动提示买卖点?

股票商场好像大海般改变多端,许多股民往往由于没有精确的生意点而错失良机,导致亏损惨重。在这种情况下,许多炒股爱好者就开始寻觅主动提示生意点的炒股软件,以便在股票商场中抢占先机。 可是,真的有这样奇特的炒股软…

高教社杯数模竞赛特辑论文篇-2018年D题:汽车总装线配置方案(附获奖论文)

目录 摘要 一、问题重述 1.1 问题背景 1.2 装配要求 1.2.1 对车辆型号的要求