最新消息,亚马逊云科技宣布Pixtral Large 25.02模型现已作为完全托管的Serverless产品,在Amazon Bedrock中正式可用。Pixtral Large由Mistral AI开发,是其首款多模态模型,融合了先进的视觉能力和强大的语言理解能力。
亚马逊云科技官网:点击访问(注册立享100+AWS免费云产品)
一、Pixtral Large介绍
Pixtral Large模型拥有128K的上下文窗口,使其成为处理复杂视觉推理任务的理想之选。在MathVista、DocVQA和VQAv2等关键基准测试中,该模型均表现出色,充分展示了其在文档分析、图表解读和自然图像理解方面的卓越效能。
更重要的是,Pixtral Large模型支持数十种语言,包括英语、法语、德语、西班牙语、意大利语、中文、日语、韩语、葡萄牙语、荷兰语和波兰语等,可供全球的团队和应用程序使用。此外,该模型还接受了80多种编程语言的训练,涵盖Python、Java、C、C++、JavaScript、Bash、Swift和Fortran等,具备强大的代码生成与解析能力。
开发者特别欣赏的是,Pixtral Large采用了以Agent为核心的设计理念,内置了函数调用和JSON格式的输出功能,与现有系统的集成操作更加简便。该模型还能够在与检索增强生成(RAG)应用和大规模上下文场景配合使用时,保持高度的可靠性。
通过使用Amazon Bedrock,用户可以很方便地访问Pixtral Large模型,且无需自行配置或管理任何基础设施。其serverless架构让用户可以灵活调整使用规模,按实际需求付费,避免了资源的闲置浪费。同时无需担心容量规划,只需根据实际使用量进行支付。
通过跨区域推理功能,Pixtral Large模型现已在多个亚马逊云科技区域的Amazon Bedrock上可用。这个功能允许跨不同的地理区域访问同一个基础模型(FM),确保全球应用程序具有高可用性和低延迟。例如当模型部署在欧洲和美国的区域时,可以通过不同的API端点来访问:欧洲使用带有“eu.model-id”的端点,美国使用“us.model-id”。
二、Pixtral Large运行效果演示亚马逊云科技官方案例:作为开发者布道师,Sébastien Stormacq一直在不断探索如何利用最新功能解决实际问题。近日,Sébastien女儿寻求其协助准备物理考试,正好成为测试Amazon Bedrock Converse API中的新多模态功能的绝佳契机。
Sébastien家里的餐桌上堆满了画满复杂图表、力矢量和方程式的模拟试卷,Sébastien女儿正苦苦思索如何解答这些题目。Sébastien意识到这正是多模态功能的完美应用场景,随即拍下其中一份有好几张图表和数学符号的高难度试卷的照片,再使用Amazon Bedrock Converse API创建能够分析图像的简易应用程序,然后上传物理考试资料,要求模型讲解解题思路。
接下来的一幕着实令Sébastien父女两人惊叹不已。该模型不仅解读了图表,识别出了法语内容和数学符号,还为每个问题提供了解题步骤讲解。当针对特定概念追问后续问题时,该模型在整个对话过程中都能保持上下文连贯,提供极为自然流畅的辅导体验。
# Effet Doppler avec une Source Sonore en Rotation
## Analyse du problème
Ce problème concerne l’effet Doppler produit par une source sonore en rotation. Une source émettant un son à 1500 Hz tourne sur une table tournante dans le sens antihoraire, et nous devons déterminer comment les fréquences sont perçues par un microphone fixe.
## Concepts clés
L’effet Doppler se produit lorsqu’il y a un mouvement relatif entre une source sonore et un observateur. La fréquence perçue dépend de si la source se rapproche ou s’éloigne de l’observateur.
La formule de l’effet Doppler est:
– Pour une source qui se rapproche: $f_{observée} = f_{source} \cdot \frac{v_{son}}{v_{son} – v_{source}}$
– Pour une source qui s’éloigne: $f_{observée} = f_{source} \cdot \frac{v_{son}}{v_{son} + v_{source}}$
## Solution étape par étape
### Étape 1: Analyser le mouvement de la source
La source tourne sur un cercle et le microphone est fixe à 40 cm du centre de rotation. Aux différentes positions (a, b, c), la source a des vitesses radiales différentes par rapport au microphone:
– Position a: La source se déplace perpendiculairement à la ligne source-microphone (vitesse radiale nulle)
– Position b: La source s’éloigne du microphone (vitesse radiale positive)
– Position c: La source se rapproche du microphone (vitesse radiale négative)
### Étape 2: Déterminer l’effet sur les fréquences perçues
– À la position a: Pas d’effet Doppler car la vitesse radiale est nulle, donc $f_a = f_{source} = 1500$ Hz
– À la position b: La source s’éloigne, donc $f_b < f_{source}$, donc $f_b < 1500$ Hz
– À la position c: La source se rapproche, donc $f_c > f_{source}$, donc $f_c > 1500$ Hz
### Étape 3: Comparer les fréquences
D’après notre analyse:
– $f_a = 1500$ Hz
– $f_b < 1500$ Hz
– $f_c > 1500$ Hz
Donc: $f_c > f_a > f_b$
## Conclusion
La proposition correcte est: $f_c > f_a > f_b$Cette réponse correspond à la troisième proposition dans l’énoncé. Lorsque la source tourne, la fréquence perçue est plus élevée quand la source se rapproche (position c), égale à la fréquence émise quand la source se déplace perpendiculairement (position a), et plus basse quand la source s’éloigne (position b).
该模型依据问题的表述来给出回答。经过缜密分析后,它给出了正确答案:fc>fa>fb。
这种交互的妙处在于Amazon Bedrock Converse API能够无缝处理多模态输入,开发者无需操心同时处理图像和文本的复杂性。这种复杂性将由API处理,并会返回结构化的响应,以便简单应用程序可以将响应结果直接呈现给用户。
本演示使用Swif编程语言编写的代码如下,向证明Python并非唯一的编程语言选择。
Be precise and accurate in your calculations
5. Use mathematical notation when appropriateFormat your response with clear section headings and numbered steps.
“””
let system: BedrockRuntimeClientTypes.SystemContentBlock = .text(systemPrompt)// Create the user message with text prompt and image
let userPrompt = “Please solve this math or physics problem. Show all steps and explain the concepts involved.”
let prompt: BedrockRuntimeClientTypes.ContentBlock = .text(userPrompt)
let image: BedrockRuntimeClientTypes.ContentBlock = .image(.init(format: .jpeg, source: .bytes(finalImageData)))// Create the user message with both text and image content
let userMessage = BedrockRuntimeClientTypes.Message(
content: [prompt, image],
role: .user
)// Initialize the messages array with the user message
var messages: [BedrockRuntimeClientTypes.Message] = []
messages.append(userMessage)// Configure the inference parameters
let inferenceConfig: BedrockRuntimeClientTypes.InferenceConfiguration = .init(maxTokens: 4096, temperature: 0.0)// Create the input for the Converse API with streaming
let input = ConverseStreamInput(inferenceConfig: inferenceConfig, messages: messages, modelId: modelId, system: [system])// Make the streaming request
do {
// Process the stream
let response = try await bedrockClient.converseStream(input: input)// Iterate through the stream events
for try await event in stream {
switch event {
case .messagestart:
print(“AI-assistant started to stream”)case let .contentblockdelta(deltaEvent):
// Handle text content as it arrives
if case let .text(text) = deltaEvent.delta {
DispatchQueue.main.async {
self.streamedResponse += text
}
}case .messagestop:
print(“Stream ended”)
// Create a complete assistant message from the streamed response
let assistantMessage = BedrockRuntimeClientTypes.Message(
content: [.text(self.streamedResponse)],
role: .assistant
)
messages.append(assistantMessage)default:
break
}
}
该应用程序的呈现效果如下。
相关推荐:
《亚马逊云科技推出Amazon Bedrock Guardrails图像内容过滤功能》
(本文由美国主机侦探原创,转载请注明出处“美国主机侦探”和原文地址!)

微信扫码加好友进群
主机优惠码及时掌握

QQ群号:938255063
主机优惠发布与交流