はじめに

Keynote の前にX 上で盛り上がっていましたが、ついに Amazon の基盤モデルである Amazon Nova がリリースされましたね! (Olympos = Nova にあたるんですかね?)

1 時間半前に並んだこともあり、とてもいいポジションに座ることができましたので、リリース時の写真を添えてお送りします!

リリース時の写真

モデルの種類

今回のリリースでは、Micro, Lite, Pro の提供がスタートし、2025 年初期に Premier のモデルが提供予定となっています。

モデルの種類

Amazon Nova Micro

Amazon Nova Micro

非常に低コストで、Amazon Nova モデル ファミリーの中で最も低いレイテンシー応答を実現するテキストのみのモデルです。

コンテキスト長が 128K トークンで、速度とコストが最適化された Amazon Nova Micro は、テキスト要約、翻訳、コンテンツ分類、インタラクティブなチャットとブレインストーミング、簡単な数学的推論とコーディングなどのタスクに優れています。

Amazon Nova Micro は、精度を高めるために微調整とモデル蒸留を使用して独自のデータをカスタマイズすることもサポートしています。

Introducing Amazon Nova

Amazon Nova Lite

Amazon Nova Lite

画像、ビデオ、テキスト入力を超高速で処理してテキスト出力を生成する、非常に低コストのマルチモーダルモデルです。

Amazon Nova Lite は、リアルタイムの顧客インタラクション、ドキュメント分析、視覚的な質問応答タスクを高精度で処理できます。

このモデルは、最大 300K トークンの長さの入力を処理し、1 回のリクエストで複数の画像または最大 30 分のビデオを分析できます。

Amazon Nova Lite はテキストとマルチモーダルの微調整もサポートしており、モデル蒸留などの手法を使用して、ユースケースに最適な品質とコストを提供するように最適化できます。

Introducing Amazon Nova

Amazon Nova Pro

Amazon Nova Pro

幅広いタスクの精度、速度、コストの最適な組み合わせを備えた、非常に高性能なマルチモーダルモデルです。

Amazon Nova Pro は、最大 30 万個の入力トークンを処理でき、複雑なワークフローを完了するために API とツールを呼び出す必要があるマルチモーダルインテリジェンスとエージェントワークフローの新しい標準を確立します。

視覚的な質問応答 ( TextVQA ) やビデオ理解 ( VATEX ) などの主要なベンチマークで最先端のパフォーマンスを実現します。

Introducing Amazon Nova

画像や動画生成も…!

Amazon Nova Canvas

Amazon Nova Canvas

自然言語から画像の生成、背景変更やレイアウトなどの編集が可能になりました。

Amazon Nova Reel

Amazon Nova Reel

テキストや画像を入力することによって、最大 6 秒の動画が生成することが可能となりました。

AWS の Youtubeに生成された動画も公開されています。

いいですね〜。かわいい。
https://www.youtube.com/watch?v=lCrkH5NVfQA&list=PLhr1KZpdzukexKQjO2YfAm7-jA_gwvy_I&index=4

さいごに

Olympos の時から楽しみにしていたリリースなのでとても嬉しいです。

今後、様々なユースケースで他モデルと比較してみて、違いやコストについてもお話しできればなと思います。