亚马逊云科技上新Pixtral Large 完全托管的Serverless产品在Amazon Bedrock中正式可用

最新消息，亚马逊云科技宣布Pixtral Large 25.02模型现已作为完全托管的Serverless产品，在Amazon Bedrock中正式可用。Pixtral Large由Mistral AI开发，是其首款多模态模型，融合了先进的视觉能力和强大的语言理解能力。

亚马逊云科技官网：点击访问（注册立享100+AWS免费云产品）

一、Pixtral Large介绍

Pixtral Large模型拥有128K的上下文窗口，使其成为处理复杂视觉推理任务的理想之选。在MathVista、DocVQA和VQAv2等关键基准测试中，该模型均表现出色，充分展示了其在文档分析、图表解读和自然图像理解方面的卓越效能。

更重要的是，Pixtral Large模型支持数十种语言，包括英语、法语、德语、西班牙语、意大利语、中文、日语、韩语、葡萄牙语、荷兰语和波兰语等，可供全球的团队和应用程序使用。此外，该模型还接受了80多种编程语言的训练，涵盖Python、Java、C、C++、JavaScript、Bash、Swift和Fortran等，具备强大的代码生成与解析能力。

开发者特别欣赏的是，Pixtral Large采用了以Agent为核心的设计理念，内置了函数调用和JSON格式的输出功能，与现有系统的集成操作更加简便。该模型还能够在与检索增强生成（RAG）应用和大规模上下文场景配合使用时，保持高度的可靠性。

通过使用Amazon Bedrock，用户可以很方便地访问Pixtral Large模型，且无需自行配置或管理任何基础设施。其serverless架构让用户可以灵活调整使用规模，按实际需求付费，避免了资源的闲置浪费。同时无需担心容量规划，只需根据实际使用量进行支付。

通过跨区域推理功能，Pixtral Large模型现已在多个亚马逊云科技区域的Amazon Bedrock上可用。这个功能允许跨不同的地理区域访问同一个基础模型（FM），确保全球应用程序具有高可用性和低延迟。例如当模型部署在欧洲和美国的区域时，可以通过不同的API端点来访问：欧洲使用带有“eu.model-id”的端点，美国使用“us.model-id”。

二、Pixtral Large运行效果演示

亚马逊云科技官方案例：作为开发者布道师，Sébastien Stormacq一直在不断探索如何利用最新功能解决实际问题。近日，Sébastien女儿寻求其协助准备物理考试，正好成为测试Amazon Bedrock Converse API中的新多模态功能的绝佳契机。

Sébastien家里的餐桌上堆满了画满复杂图表、力矢量和方程式的模拟试卷，Sébastien女儿正苦苦思索如何解答这些题目。Sébastien意识到这正是多模态功能的完美应用场景，随即拍下其中一份有好几张图表和数学符号的高难度试卷的照片，再使用Amazon Bedrock Converse API创建能够分析图像的简易应用程序，然后上传物理考试资料，要求模型讲解解题思路。

接下来的一幕着实令Sébastien父女两人惊叹不已。该模型不仅解读了图表，识别出了法语内容和数学符号，还为每个问题提供了解题步骤讲解。当针对特定概念追问后续问题时，该模型在整个对话过程中都能保持上下文连贯，提供极为自然流畅的辅导体验。

# Effet Doppler avec une Source Sonore en Rotation

## Analyse du problème
Ce problème concerne l’effet Doppler produit par une source sonore en rotation. Une source émettant un son à 1500 Hz tourne sur une table tournante dans le sens antihoraire, et nous devons déterminer comment les fréquences sont perçues par un microphone fixe.
## Concepts clés
L’effet Doppler se produit lorsqu’il y a un mouvement relatif entre une source sonore et un observateur. La fréquence perçue dépend de si la source se rapproche ou s’éloigne de l’observateur.
La formule de l’effet Doppler est:
– Pour une source qui se rapproche: $f_{observée} = f_{source} \cdot \frac{v_{son}}{v_{son} – v_{source}}$
– Pour une source qui s’éloigne: $f_{observée} = f_{source} \cdot \frac{v_{son}}{v_{son} + v_{source}}$
## Solution étape par étape
### Étape 1: Analyser le mouvement de la source
La source tourne sur un cercle et le microphone est fixe à 40 cm du centre de rotation. Aux différentes positions (a, b, c), la source a des vitesses radiales différentes par rapport au microphone:
– Position a: La source se déplace perpendiculairement à la ligne source-microphone (vitesse radiale nulle)
– Position b: La source s’éloigne du microphone (vitesse radiale positive)
– Position c: La source se rapproche du microphone (vitesse radiale négative)
### Étape 2: Déterminer l’effet sur les fréquences perçues
– À la position a: Pas d’effet Doppler car la vitesse radiale est nulle, donc $f_a = f_{source} = 1500$ Hz
– À la position b: La source s’éloigne, donc $f_b < f_{source}$, donc $f_b < 1500$ Hz
– À la position c: La source se rapproche, donc $f_c > f_{source}$, donc $f_c > 1500$ Hz
### Étape 3: Comparer les fréquences
D’après notre analyse:
– $f_a = 1500$ Hz
– $f_b < 1500$ Hz
– $f_c > 1500$ Hz
Donc: $f_c > f_a > f_b$
## Conclusion
La proposition correcte est: $f_c > f_a > f_b$

Cette réponse correspond à la troisième proposition dans l’énoncé. Lorsque la source tourne, la fréquence perçue est plus élevée quand la source se rapproche (position c), égale à la fréquence émise quand la source se déplace perpendiculairement (position a), et plus basse quand la source s’éloigne (position b).

该模型依据问题的表述来给出回答。经过缜密分析后，它给出了正确答案：fc>fa>fb。

这种交互的妙处在于Amazon Bedrock Converse API能够无缝处理多模态输入，开发者无需操心同时处理图像和文本的复杂性。这种复杂性将由API处理，并会返回结构化的响应，以便简单应用程序可以将响应结果直接呈现给用户。

本演示使用Swif编程语言编写的代码如下，向证明Python并非唯一的编程语言选择。

Be precise and accurate in your calculations
5. Use mathematical notation when appropriate

Format your response with clear section headings and numbered steps.
“””
let system: BedrockRuntimeClientTypes.SystemContentBlock = .text(systemPrompt)

// Create the user message with text prompt and image
let userPrompt = “Please solve this math or physics problem. Show all steps and explain the concepts involved.”
let prompt: BedrockRuntimeClientTypes.ContentBlock = .text(userPrompt)
let image: BedrockRuntimeClientTypes.ContentBlock = .image(.init(format: .jpeg, source: .bytes(finalImageData)))

// Create the user message with both text and image content
let userMessage = BedrockRuntimeClientTypes.Message(
content: [prompt, image],
role: .user
)

// Initialize the messages array with the user message
var messages: [BedrockRuntimeClientTypes.Message] = []
messages.append(userMessage)

// Configure the inference parameters
let inferenceConfig: BedrockRuntimeClientTypes.InferenceConfiguration = .init(maxTokens: 4096, temperature: 0.0)

// Create the input for the Converse API with streaming
let input = ConverseStreamInput(inferenceConfig: inferenceConfig, messages: messages, modelId: modelId, system: [system])

// Make the streaming request
do {
// Process the stream
let response = try await bedrockClient.converseStream(input: input)

// Iterate through the stream events
for try await event in stream {
switch event {
case .messagestart:
print(“AI-assistant started to stream”)

case let .contentblockdelta(deltaEvent):
// Handle text content as it arrives
if case let .text(text) = deltaEvent.delta {
DispatchQueue.main.async {
self.streamedResponse += text
}
}

case .messagestop:
print(“Stream ended”)
// Create a complete assistant message from the streamed response
let assistantMessage = BedrockRuntimeClientTypes.Message(
content: [.text(self.streamedResponse)],
role: .assistant
)
messages.append(assistantMessage)

default:
break
}
}

该应用程序的呈现效果如下。