首页 Metaverse 基于80多种编程语言训练,法国人工智能初创公司Mistral AI发布编码模型Codestral
基于80多种编程语言训练,法国人工智能初创公司Mistral AI发布编码模型Codestral

基于80多种编程语言训练,法国人工智能初创公司Mistral AI发布编码模型Codestral

  近日,据海外媒体报道,法国的人工智能初创公司Mistral AI发布了面向编码开发的大语言模型Codestral,这也是其第一款专门面向这一领域的大语言模型。Codestral有22B的参数,并且是开源模型,在非商业用途下可以使用。

  根据Mistral AI公司的说法,Codestral模型专门研究了80多种编程语言,使其有希望成为高级AI应用程序的软件开发人员的理想工具。这使得它适用于各种编码任务,包括从头生成代码、完成编码功能、编写测试和使用中间填充机制完成任何部分代码。它涵盖的编程语言包括SQL、Python、Java、C和c++等流行语言,以及Swift和Fortran等更具体的语言。同时,该公司称,Codestral的能力已经超越了之前几款专门为编码任务设计的模型,包括CodeLlama 70B和Deepseek Coder 33B,并且已经被几家行业合作伙伴在使用,包括JetBrains、SourceGraph和LlamaIndex。

  Codestral的上下文长度为32K,为开发人员提供了在各种编码环境和项目中编写和交付代码的能力。Mistral AI公司表示,Codestral可以帮助开发人员可以加快工作流程,并在构建应用程序时节省大量的时间和精力,还可以帮助减少错误和bug的风险。

  在用于评估Python代码完成的RepoBench上,Codestral的准确率达到34%。同样,在评估Python代码生成的HumanEval和测试Python输出预测的CruxEval上,Codestral模型分别以81.1%和51.3%的分数击败了竞争对手。它甚至优于Bash、Java和PHP的HumanEval模型。

  值得注意的是,Codestral模型在C++, C和Typescript的HumanEval上的表现并不是最好的,但所有测试的平均得分最高,达到61.5%,仅次于Llama3 70B(61.2%)。在Spider对SQL性能的评估中,它以63.5%的得分位居第二。

  LangChain联合创始人及首席执行官Harrison Chase表示,从我们最初的测试来看,它是代码生成工作流的一个很好的选择,因为它速度快,并且有支持工具辅助使用。我们使用指导Codestral工具对LangGraph进行了自我纠错代码生成的测试,结果表明它非常有效。

  另外,Codestral还提供API为使用接入模型,codestral.mistral.ai和api.mistral.ai。前者是为希望在IDE中使用Codestral的指令或中间填充的用户设计的,它附带了一个在个人级别管理的API密钥,并且有八周的免费使用。而后者是更广泛的研究、批量查询或第三方应用程序开发的API接口,按令牌(token)计费。

  目前,开发人员还可以通过在Mistral AI的对话机器人Le Chat上来测试Codestral的功能。

延伸阅读:

Powered by Froala Editor