首页 Metaverse Google Bard发布更新,对逻辑和推理有更好的反馈
Google Bard发布更新,对逻辑和推理有更好的反馈

Google Bard发布更新,对逻辑和推理有更好的反馈

  近日,据海外媒体的报道,Google公司发布了其人工智能聊天机器人Google Bard的两个更新。其中一个更新是让Bard更加擅长数学任务、编码问题和字符串操作。另外一个更新是允许用户将Bard生成的表格直接导出到Google Sheets中。

  据介绍,Google Bard有一项名为“隐式代码执行”(implicit code execution)的新技术,可以帮助Bard检测计算提示并在后台运行代码。Google公司解释道,这使得Google Bard能够更准确地回答数学任务、编码问题和字符串操作提示。

  大语言模型就像预测引擎,当给定一个提示时,大语言模型会通过预测接下来可能出现的单词来生成响应。因此,大语言模型在创造性任务方面非常有潜力,但在推理和数学等领域则较弱。为了用高级推理和逻辑能力帮助解决更复杂的问题,仅仅依靠大语言模型输出是不够的。

  Google的新方法是允许Bard生成和执行代码,以提高其推理和数学能力。这种方法的灵感来自于Daniel Kahneman的《思考,快与慢》(Thinking, Fast and Slow)一书中对人类智力二分法的深入研究:“系统1”和“系统2”思维的分离。

  系统1思维是快速、直观和毫不费力的。当一个爵士音乐家在现场即兴演奏,或者一个打字员在思考一个单词并看着它出现在屏幕上时,他们正在使用的就是系统1思维。

  相比之下,系统2思维则是缓慢的、深思熟虑的、费力的。当你进行长除法运算或学习演奏乐器时,你则是在使用系统2思维。

  在这个类比中,大语言模型可以被认为是纯粹在系统1思维下操作,快速生成文本,但没有深入思考。这带来了一些令人难以置信的能力,但也可能会出现一些令人惊讶的不足之处。传统的计算与系统2的思维密切相关:它是公式化的且不灵活的,但正确的步骤顺序可以产生令人印象深刻的结果,例如长除法的解答。

  在最新的更新中,Google结合了大语言模型(系统1思维)和传统代码(系统2思维)的功能,以帮助提高Bard响应的准确性。通过隐式代码执行,Bard的识别可能受益于逻辑代码的提示,“在底层”进行编写,执行并使用结果生成更准确的响应。到目前为止,我们已经看到这种方法将Bard对基于计算的单词和数学问题的回答准确性提高了大约30%。

  即使有了这些改进,Bard也不会总是正确的。例如,Bard可能不会生成代码来帮助快速响应,它生成的代码可能是错误的,或者Bard可能没有在其响应中包含执行的代码。综上所述,这种通过结构化、逻辑驱动的能力进行响应的改进是使Bard变得更有帮助的重要一步。

Powered by Froala Editor