AIサービス一覧に戻る

サービス概要

Geminiは、GoogleのマルチモーダルLLM(大規模言語モデル)へのインターフェースで、テキスト、音声、画像などを処理できます。2023年3月にBardとして実験的にローンチされ、現在では多用途なAIツールとして進化しています。

主要機能

生産性向上

  • 長い研究文書のアップロードと要約機能
  • コーディングタスクの支援(最も人気のある用途の一つ)
  • Gmail、Google Calendar、Google Maps、YouTube、Google Photosとの連携により、アプリを切り替えることなく必要な情報を検索可能

創造性支援

  • ブログ記事のアウトライン作成と画像生成
  • Imagen 4を使用した高品質な画像生成
  • 8秒間の高品質動画作成機能

学習支援

  • 複雑な概念の簡単な説明
  • 学習プラン、トピック要約、テスト用クイズの作成
  • Gemini Liveを使った音声での対話学習

先進機能

Gemini Live

アイデアのブレインストーミング、面接練習、ファイルや写真の議論を音声で行える対話機能

Deep Research

数百のウェブサイトを検索し、情報を分析して包括的なレポートを数分で作成する機能

Gems

詳細な指示とファイルアップロードにより、キャリアコーチやコーディングヘルパーなどのカスタムAIエキスパートを構築可能

2025年8月1日時点の情報