はじめに
Keynote の前にX 上で盛り上がっていましたが、ついに Amazon の基盤モデルである Amazon Nova がリリースされましたね! (Olympos = Nova にあたるんですかね?)
1 時間半前に並んだこともあり、とてもいいポジションに座ることができましたので、リリース時の写真を添えてお送りします!

モデルの種類
今回のリリースでは、Micro, Lite, Pro の提供がスタートし、2025 年初期に Premier のモデルが提供予定となっています。

Amazon Nova Micro

非常に低コストで、Amazon Nova モデル ファミリーの中で最も低いレイテンシー応答を実現するテキストのみのモデルです。
コンテキスト長が 128K トークンで、速度とコストが最適化された Amazon Nova Micro は、テキスト要約、翻訳、コンテンツ分類、インタラクティブなチャットとブレインストーミング、簡単な数学的推論とコーディングなどのタスクに優れています。
Amazon Nova Micro は、精度を高めるために微調整とモデル蒸留を使用して独自のデータをカスタマイズすることもサポートしています。
Amazon Nova Lite

画像、ビデオ、テキスト入力を超高速で処理してテキスト出力を生成する、非常に低コストのマルチモーダルモデルです。
Amazon Nova Lite は、リアルタイムの顧客インタラクション、ドキュメント分析、視覚的な質問応答タスクを高精度で処理できます。
このモデルは、最大 300K トークンの長さの入力を処理し、1 回のリクエストで複数の画像または最大 30 分のビデオを分析できます。
Amazon Nova Lite はテキストとマルチモーダルの微調整もサポートしており、モデル蒸留などの手法を使用して、ユースケースに最適な品質とコストを提供するように最適化できます。
Amazon Nova Pro

幅広いタスクの精度、速度、コストの最適な組み合わせを備えた、非常に高性能なマルチモーダルモデルです。
Amazon Nova Pro は、最大 30 万個の入力トークンを処理でき、複雑なワークフローを完了するために API とツールを呼び出す必要があるマルチモーダルインテリジェンスとエージェントワークフローの新しい標準を確立します。
視覚的な質問応答 ( TextVQA ) やビデオ理解 ( VATEX ) などの主要なベンチマークで最先端のパフォーマンスを実現します。
画像や動画生成も…!
Amazon Nova Canvas

自然言語から画像の生成、背景変更やレイアウトなどの編集が可能になりました。
Amazon Nova Reel

テキストや画像を入力することによって、最大 6 秒の動画が生成することが可能となりました。
AWS の Youtubeに生成された動画も公開されています。
いいですね〜。かわいい。
https://www.youtube.com/watch?v=lCrkH5NVfQA&list=PLhr1KZpdzukexKQjO2YfAm7-jA_gwvy_I&index=4
さいごに
Olympos の時から楽しみにしていたリリースなのでとても嬉しいです。
今後、様々なユースケースで他モデルと比較してみて、違いやコストについてもお話しできればなと思います。