Gemini
基本情報
正式名称
Gemini
読み方
じぇみに
原語
Gemini
原語(国際音声記号)
/ˈdʒɛmɪnaɪ/
定義の要約
Googleが開発したマルチモーダル対応の生成AIモデル。テキスト、画像、音声、動画、コードなど複数の情報を同時に理解・処理できる大規模言語モデル(LLM)群である。
NDC分類
0-00-007.13
最終更新日
2025-11-28
基本解説
Googleが開発した大規模言語モデル(LLM)群であり、特にテキスト、画像、音声、動画、コードといった複数のデータ形式を同時に学習・処理できるマルチモーダルAIモデルとして設計されている。モデル群には、デバイス上での実行を想定した「Gemini Nano」や、最も高性能な「Gemini Advanced」などがある。
語源・発見者
Googleが開発。2023年12月に発表され、初期の対話型AIサービス名「Bard」が、2024年2月に基盤モデル名である「Gemini」に名称変更された。モデル名は、Googleの過去のAIモデルであるLaMDAやPaLM 2の後継として位置づけられる。
具体例・用途
高度な情報処理:複雑な文字情報や視覚情報を理解し、金融や科学分野の調査・研究を加速。日常業務支援:メールの文面作成、長文の要約・翻訳、企画のアイデア出し。Google Workspace(Gmail, ドキュメントなど)との連携により作業効率を向上させる。コード生成:プログラミング言語のコードを理解し、新規コード生成や既存コードのエラー修正案を提示可能。マルチモーダル活用:カメラや音声連携によるリアルタイム翻訳や画像検索、音声データからの議事録要約など。



