注意
本文最后更新于 2023-12-22,文中内容可能已过时。
本文将通过 Python 代码探索 Amazon Titan 文本模型系列(包括 Express、Lite 和 Embedding)。
1 认识 Amazon Titan
Amazon Titan 是来自亚马逊云科技的高性能基础模型。Amazon Bedrock 独有的 Amazon Titan 系列模型融合了 Amazon 25 年来,在其业务范围内积累的人工智能和机器学习创新的经验。Amazon Titan 基础模型(FM)通过完全托管的 API 为客户提供广泛的高性能图像、多模式和文本模型选择。Amazon Titan 模型由 AWS 创建并在大型数据集上进行预训练,使其成为强大的通用模型,旨在支持各种用例,同时还支持负责任地使用 AI。你可以按原样使用,也可以根据自己的数据私下进行自定义。
Amazon Titan 文本模型系列包括:
- Titan Text Express
- Titan Text Lite
- Titan Text Embeddings
- Titan 多模态嵌入
- Titan Image Generator(预览版)
本文主要探索 Express、Lite 和 Embeddings。更多细节和其他模型请访问 Amazon Titan 文本模型系列。
如果你还没有注册亚马逊云科技账户,可以参考本文最后一节 注册亚马逊云科技账户。
2 环境准备
我正在使用配置了 AWS Credential 的 vscode 本地环境。
2.1 安装最新的 Python
1
2
| python --version
# Python 3.11.5
|
2.2 升级 pip
1
| pip install --upgrade pip
|
2.3 安装依赖
1
2
3
4
| pip install --no-build-isolation --force-reinstall \
"boto3>=1.33.6" \
"awscli>=1.31.6" \
"botocore>=1.33.6"
|
2.4 加载库
1
2
3
4
5
6
7
8
9
| import json
import os
import sys
import boto3
import botocore
bedrock = boto3.client(service_name="bedrock")
bedrock_runtime = boto3.client(service_name="bedrock-runtime")
|
3 Titan 文本模型 - Express
3.1 设置 Prompt
1
2
| # 写一个关于 AWS Lambda 的文章
express_prompt = "write article about AWS Lambda"
|
3.2 配置模型
1
2
3
4
5
6
7
8
9
| body = json.dumps({
"inputText": express_prompt,
"textGenerationConfig": {
"maxTokenCount": 128,
"stopSequences": [], # 定义指示模型结束文本生成的短语
"temperature": 0, # 温度控制随机性;较高的值会增加多样性,较低的值会提高可预测性
"topP": 0.9 # Top P 是一种文本生成技术,从分布中最可能的标记中采样
}
})
|
3.3 调用模型
1
2
3
4
5
6
| response = bedrock_runtime.invoke_model(
body=body,
modelId="amazon.titan-text-express-v1",
accept="application/json",
contentType="application/json"
)
|
3.4 解析配置
1
2
3
4
5
6
7
| response_body = json.loads(response.get('body').read())
outputText = response_body.get('results')[0].get('outputText')
# 代码 text = outputText[outputText.index('\n')+1:] 提取 outputText 字符串中第一个换行符后面的子字符串。这对于第一个换行符之前的初始内容不相关并且您想要捕获其后面的文本的情况非常有用。index('\n')+1 定位第一个换行符的位置,切片 [index+1:] 取出后续文本,将其赋值给变量 text
text = outputText[outputText.index('\n')+1:]
about_lambda = text.strip()
print(about_lambda)
|
3.5 运行结果
1
2
3
4
5
| AWS Lambda is a serverless computing service provided by Amazon Web Services (AWS). It allows developers to run code in response to events without the need to manage any infrastructure. In this article, we will explore the features and benefits of AWS Lambda, as well as how to use it to build serverless applications.
Features and Benefits of AWS Lambda:
Serverless Computing: AWS Lambda is a serverless computing service, which means that developers do not have to worry about managing servers, operating systems, or infrastructure. Lambda runs the code in an environment that is managed by AWS, and scales automatically based
|
4 Titan 文本模型 - Lite
4.1 设置 Prompt
1
2
| # AWS DynamoDB 和 AWS Redis 两个 AWS 服务的区别
lite_prompt = "2 difference between AWS DynamoDB and AWS Redis"
|
4.2 配置模型
1
2
3
4
5
6
7
8
9
| body = json.dumps({
"inputText": lite_prompt,
"textGenerationConfig": {
"maxTokenCount": 128,
"stopSequences": [], # 定义指示模型结束文本生成的短语
"temperature": 0, # 温度控制随机性;较高的值会增加多样性,较低的值会提高可预测性
"topP": 0.9 # Top P 是一种文本生成技术,从分布中最可能的标记中采样
}
})
|
4.3 调用模型
1
2
3
4
5
6
| response = bedrock_runtime.invoke_model(
body=body,
modelId="amazon.titan-text-lite-v1",
accept="application/json",
contentType="application/json"
)
|
4.4 解析配置
1
2
3
4
5
| response_body = json.loads(response.get('body').read())
outputText = response_body.get('results')[0].get('outputText')
text = outputText[outputText.index('\n')+1:]
compare_dynamodb_redis = text.strip()
print(compare_dynamodb_redis)
|
4.5 运行结果
1
| Amazon DynamoDB is a fully managed NoSQL database service in the cloud that offers fast and predictable performance with seamless scalability. It is designed to run high-performance applications at any scale. On the other hand, Amazon Redis is a fully managed in-memory data structure store that provides real-time analytics, caching, and key-value data storage. It is suitable for applications that require fast data retrieval and low latency.
|
5 Titan 文本模型 - Embeddings
5.1 设置 Prompt
1
2
| # AWS re:Invent 2023 是我们今年最大的云活动,在内华达州拉斯维加斯举行,包括主题演讲、创新讲座、构建者实验室、研讨会、技术和可持续发展演示
embed_prompt = "AWS re:Invent 2023, our biggest cloud event of the year, in Las Vegas, Nevada, featured keynotes, innovation talks, builder labs, workshops, tech and sustainability demos"
|
5.2 配置模型
1
2
3
| body = json.dumps({
"inputText": embed_prompt,
})
|
5.3 调用模型
1
2
3
4
5
6
| response = bedrock_runtime.invoke_model(
body=body,
modelId="amazon.titan-embed-text-v1",
accept="application/json",
contentType="application/json"
)
|
5.4 解析配置
1
2
3
4
5
| response_body = json.loads(response.get("body").read())
embedding_output = response_body.get("embedding")
# 此代码从响应正文中检索“嵌入”向量,并打印其长度以及前三个和最后三个值的预览,显示嵌入向量的片段
print(f"You can find the Embedding Vector {len(embedding_output)} values\n{embedding_output[0:3]+['...']+embedding_output[-3:]}")
|
5.5 运行结果
1
2
| You can find the Embedding Vector 1536 values
[0.40429688, -0.38085938, 0.19726562, '...', 0.2109375, 0.012573242, 0.18847656]
|
6 注册亚马逊云科技账户
打开 亚马逊云科技账号注册地址,点击右上角创建 AWS 账户。
- 填写邮件地址和账号名称(支持使用国内的邮箱)
- 验证邮件
- 输入密码
- 联系人信息
- 付款信息(Visa)
- 验证手机号(支持中国地区国内手机号)
- 选择支持计划
- 完成注册
- 登录亚马逊云科技控制台,登录地址,选择根用户输入电子邮件地址,点击下一步会让输入密码,输入密码后就可以完成登录了。