AIサービス一覧に戻る
サービス概要
Geminiは、GoogleのマルチモーダルLLM(大規模言語モデル)へのインターフェースで、テキスト、音声、画像などを処理できます。2023年3月にBardとして実験的にローンチされ、現在では多用途なAIツールとして進化しています。
主要機能
生産性向上
- 長い研究文書のアップロードと要約機能
- コーディングタスクの支援(最も人気のある用途の一つ)
- Gmail、Google Calendar、Google Maps、YouTube、Google Photosとの連携により、アプリを切り替えることなく必要な情報を検索可能
創造性支援
- ブログ記事のアウトライン作成と画像生成
- Imagen 4を使用した高品質な画像生成
- 8秒間の高品質動画作成機能
学習支援
- 複雑な概念の簡単な説明
- 学習プラン、トピック要約、テスト用クイズの作成
- Gemini Liveを使った音声での対話学習
先進機能
Gemini Live
アイデアのブレインストーミング、面接練習、ファイルや写真の議論を音声で行える対話機能
Deep Research
数百のウェブサイトを検索し、情報を分析して包括的なレポートを数分で作成する機能
Gems
詳細な指示とファイルアップロードにより、キャリアコーチやコーディングヘルパーなどのカスタムAIエキスパートを構築可能
2025年8月1日時点の情報