内容紹介
生成AIを使った動画解析の基礎から実践までを説明
本書は、生成AIを使った動画解析の基礎から実践までを、フルスクラッチで説明した書籍です。読者自ら、Pythonを使って簡単な動画解析プログラムが作成できるよう、生成AIを使った動画解析のしくみから具体的なプログラムのサンプルコードまでを1冊にまとめています。
これまでに収集した未処理の動画データを活用して有用な結果を得たい方、動画解析を使ってこれまでにないサービスを実現したい方におすすめの書籍です。
このような方におすすめ
AI、機械学習の研究者・実務者、および学生
広くICTの技術者・実務者、および学生
目次
主要目次
第1章 生成AIとヒューマンセンシング
第2章 人間を対象とした解析
第3章 実行環境の準備と画像解析モデルの基礎
第4章 コンピュータヴィジョン
第5章 パイプライン導入
第6章 ヒューマンセンシングAI
第7章 LLMチュートリアル
第8章 マルチモーダル技術の基礎
第9章 ヒューマンセンシングと生成AIの融合
詳細目次
第1章 生成AIとヒューマンセンシング
1.1 ヒューマンセンシング
1.2 ヒューマンセンシング技術の類型
1.3 深層学習による画像解析とヒューマンセンシング
1.4 デジタルトランスフォーメーション
1.5 ヒューマンセンシングAIの特長
第2章 人間を対象とした解析
2.1 可能性
2.2 注意点
2.3 生成AIとヒューマンセンシング
第3章 実行環境の準備と画像解析モデルの基礎
3.1 画像解析モデルの実行環境
3.2 Pythonの各種ライブラリ
第4章 コンピュータヴィジョン
4.1 画像とは
4.2 画像データの読み込み
4.3 画像データの編集
4.4 動画とは
4.5 動画データの読み込み
4.6 動画データの編集
第5章 パイプライン導入
5.1 パイプライン
5.2 実装例
第6章 ヒューマンセンシングAI
6.1 物体検出
6.2 姿勢推定
6.3 セグメンテーション
6.4 動画への適用
第7章 LLMチュートリアル
7.1 LLMアーキテクチャ
7.2 ファインチューニング
7.3 出力文の生成
7.4 LLM の実装例
第8章 マルチモーダル技術の基礎
8.1 マルチモーダル技術とは
8.2 マルチモーダルモデル
8.3 画像キャプショニングとVQAの実践例
8.4 ゼロショット画像分類
8.5 Grounding DINO
第9章 ヒューマンセンシングと生成AIの融合
9.1 ヒューマンセンシングと生成AIの融合がもたらすインパクト
9.2 具体的な活用例
9.3 生成AIブームが終わった後も
続きを見る