所有tag为书生大模型的文档,连同本文档在内,为书生大模型实战营训练内容,文档中的内容并不局限于实战营本身,但算力平台均首选上海AI实验室开发的云端集成开发环境InternStudio开发手册InternStudio算力平台的相关内容可以点击链接跳转。

1. 书生产品矩阵

在上一篇文章中已经介绍了书生大模型全链路开源体系,这次就来实际使用以下其中的部分产品。

目前书生系列下的所有产品均免费向所有社区用户提供服务。还真没有套路。

1.1 书生·浦语

1.1.1 对话

书生·浦语是于原生的 InternLM2.5 最新 Chat 模型 (InternLM2.5-20B) 搭建聊天机器人应用。目前注册用户默认开放3百万Tokens/月的API调用额度。

image
image

与其他所有在线大语言模型相同,可以与浦语进行进行包括”代码编程、文章创作、灵感创意、角色扮演、语言翻译、逻辑推理等等”任意主题的对话,也可在对话内尝试prompt enginering让浦语完成更复杂任务。当然,也可以简单地让它介绍一下自己:

image
image

1.1.2 API

在左侧导航栏点击“更多”即可进入 API 控制台

image
image

API控制台内包含 “API 文档”、“API Tokens”、“限流策略”、“调用明细” 4个模块,可以尝试以调用浦语ChatAPI的用户视角了解这4个模块的功能。

image
image

API 文档中给出了

  • API URL
  • API Auth
  • Python、Curl、openai库的调用示例
  • 请求参数、返回参数说明

其中,浦语API已经支持Tool Call(Beta)功能。所有字段与OpenAI的调用泛式对齐,让使用ChatGPT API格式的用户可以无缝切换到浦语API。以下是使用 curl 工具非流式调用浦语 API 的一段示例代码:

curl --location 'https://internlm-chat.intern-ai.org.cn/puyu/api/v1/chat/completions' \
--header 'Authorization: Bearer xxxxxxx' \
--header 'Content-Type: application/json' \
--data '{
        "model": "internlm2.5-latest",  
        "messages": [{
                "role": "user",
                "content": "你知道刘慈欣吗?"
        }, {
                "role": "assistant",
                "content": "为一个人工智能助手,我知道刘慈欣。他是一位著名的中国科幻小说家和工程师,曾经获得过多项奖项,包括雨果奖、星云奖等。"
        },{
                "role": "user",
                "content": "他什么作品得过雨果奖?"
        }],
        "temperature": 0.8,
        "top_p": 0.9
}'

从上面的代码可以看到,调用浦语 API 时需要在请求Header内传入Authorization Tokens(Authorization: Bearer xxxxxxx)参数用于用户身份验证。需要在API Tokens模块内创建此API Tokens替换掉xxxxxxx (本人已经创造了两个)。

image
image

注意在最后一步时不要着急点确认,先复制好tokens妥善保管到自己的文件或者权限管理服务中。点击确认后将不再显示此Token

如图所示,目前Chat API支持以internlm2.5-latestinternlm2-latest作为 model ID,它将默认指向最新的模型。官方可能会定期上线一些新版的模型,或者改变internlm2.5-latest模型指向的实际模型版本。可以通过Model API查询当前可用的模型ID。

image
image

官方为所有社区新注册的用户提供了1百万Input Tokens/月,3百万Output Tokens/月的免费调用额度

可在APIUsage模块查看到本月已用Tokens的数量,以及请求次数、请求Tokens的历史调用曲线。

image
image

API限流策略模块可以查询到这个账户调用API频率的流控限制,所有新注册的社区用户默认值为:

  • RPM (Requests per Minute):10
  • TPM (Tokens per Minute):5000

2.MindSearch

MindSearch是一个开源的 AI 搜索引擎。它会对你提出的问题进行分析并拆解为数个子问题,在互联网上搜索、总结得到各个子问题的答案,最后通过模型总结得到最终答案

书生·浦语上的智能体为MindSearch的官方实现(基于InternLM2.5-20B),具有与Perplexity.ai Pro 相当的性能。 我们尝试问它一个问题:

最近大火的中国3A大作,《黑神话·悟空》里有什么让你难忘的精彩故事情节?

image
image

可以观察到它输出回答的过程,包括“思考”、“信息来源”、“信息耦合”等各个部分。

再问它一个问题:

请解释一下MBTI性格测试结果中4个字母的含义,并描述一下由它们组成的16类性格的特征。

image
image

同样的,可以观察到思考节点和整合过程。

3.书生·万象

在7月4日举行的2024 WAIC科学前沿主论坛上,上海人工智能实验室(上海AI实验室)发布并开源书生·万象模态大模型(InternVL 2.0)。书生·万象支持图像、视频、文字、语音、三维点云等模态处理,具备强大的真实世界感知能力。

为了体验它的能力,直接把刚刚书生浦语的回答让它识别和分析:

image
image

换一张人物图看看试试。将下面这张照片上传给它:

image
image
image
image

准确率相当高!感兴趣的小伙伴可以自己试一下!