Gemini

サービス概要

Geminiは、GoogleのマルチモーダルLLM（大規模言語モデル）へのインターフェースで、テキスト、音声、画像などを処理できます。2023年3月にBardとして実験的にローンチされ、現在では多用途なAIツールとして進化しています。

長い研究文書のアップロードと要約機能
コーディングタスクの支援（最も人気のある用途の一つ）
Gmail、Google Calendar、Google Maps、YouTube、Google Photosとの連携により、アプリを切り替えることなく必要な情報を検索可能

アイデアのブレインストーミング、面接練習、ファイルや写真の議論を音声で行える対話機能

数百のウェブサイトを検索し、情報を分析して包括的なレポートを数分で作成する機能

詳細な指示とファイルアップロードにより、キャリアコーチやコーディングヘルパーなどのカスタムAIエキスパートを構築可能

2025年8月1日時点の情報