基于80多种编程语言训练，法国人工智能初创公司Mistral AI发布编码模型Codestral-Metaverse-映魅咨询-imconsultancy

基于80多种编程语言训练，法国人工智能初创公司Mistral AI发布编码模型Codestral

　　近日，据海外媒体报道，法国的人工智能初创公司Mistral AI发布了面向编码开发的大语言模型Codestral，这也是其第一款专门面向这一领域的大语言模型。Codestral有22B的参数，并且是开源模型，在非商业用途下可以使用。

　　根据Mistral AI公司的说法，Codestral模型专门研究了80多种编程语言，使其有希望成为高级AI应用程序的软件开发人员的理想工具。这使得它适用于各种编码任务，包括从头生成代码、完成编码功能、编写测试和使用中间填充机制完成任何部分代码。它涵盖的编程语言包括SQL、Python、Java、C和c++等流行语言，以及Swift和Fortran等更具体的语言。同时，该公司称，Codestral的能力已经超越了之前几款专门为编码任务设计的模型，包括CodeLlama 70B和Deepseek Coder 33B，并且已经被几家行业合作伙伴在使用，包括JetBrains、SourceGraph和LlamaIndex。

　　Codestral的上下文长度为32K，为开发人员提供了在各种编码环境和项目中编写和交付代码的能力。Mistral AI公司表示，Codestral可以帮助开发人员可以加快工作流程，并在构建应用程序时节省大量的时间和精力，还可以帮助减少错误和bug的风险。

　　在用于评估Python代码完成的RepoBench上，Codestral的准确率达到34%。同样，在评估Python代码生成的HumanEval和测试Python输出预测的CruxEval上，Codestral模型分别以81.1%和51.3%的分数击败了竞争对手。它甚至优于Bash、Java和PHP的HumanEval模型。

　　值得注意的是，Codestral模型在C++， C和Typescript的HumanEval上的表现并不是最好的，但所有测试的平均得分最高，达到61.5%，仅次于Llama3 70B（61.2%）。在Spider对SQL性能的评估中，它以63.5%的得分位居第二。

　　LangChain联合创始人及首席执行官Harrison Chase表示，从我们最初的测试来看，它是代码生成工作流的一个很好的选择，因为它速度快，并且有支持工具辅助使用。我们使用指导Codestral工具对LangGraph进行了自我纠错代码生成的测试，结果表明它非常有效。

　　另外，Codestral还提供API为使用接入模型，codestral.mistral.ai和api.mistral.ai。前者是为希望在IDE中使用Codestral的指令或中间填充的用户设计的，它附带了一个在个人级别管理的API密钥，并且有八周的免费使用。而后者是更广泛的研究、批量查询或第三方应用程序开发的API接口，按令牌（token）计费。

　　目前，开发人员还可以通过在Mistral AI的对话机器人Le Chat上来测试Codestral的功能。

延伸阅读：

基于80多种编程语言训练，法国人工智能初创公司Mistral AI发布编码模型Codestral

人工智能搜索引擎You.com发布新功能，让用户选择语言模型以创建自定义的智能助手

OpenAI加速与媒体授权合作进度，又和《大西洋月刊》、Vox Media达成内容授权和技术合作

基于80多种编程语言训练，法国人工智能初创公司Mistral AI发布编码模型Codestral

人工智能搜索引擎You.com发布新功能，让用户选择语言模型以创建自定义的智能助手

OpenAI加速与媒体授权合作进度，又和《大西洋月刊》、Vox Media达成内容授权和技术合作

相关推荐

与量子计算公司Multiverse Computing合作，博世将在西班牙打造“数字孪生”智能工厂

英伟达分享在元宇宙领域的最新技术进展，并推出新的3D内容开发工具包

以色列数字孪生及计算机视觉公司Resonai融资2000万美元，提供数字化的建筑空间资产解决方案