1. トップ
  2. 新着ニュース
  3. IT
  4. デジタル家電

映像を生成AIでテキスト化! ネットワークカメラ「ATOM Cam GPT」を試して分かった実用性

ITmedia PC USER / 2024年8月1日 17時0分

 もしかするとカメラの前を通過する時間が短すぎるせいかと思い、本製品をTVの画面に向けっぱなしにしてしばらく放置してみたところ、料理番組や旅番組、バラエティー、スポーツ中継など、ジャンルに応じてそれらの内容がテキスト化された。ある程度長い時間に渡って映れば、それなりにテキスト化されるようだ。対応するジャンルも、少ないわけではないようである。

 もっとも、この場合もモーション検知のきっかけになった動きは無視され、その瞬間に映っているものだけをテキスト化する傾向は変わらなかった。見た目は動画を解析しているようで、実際には静止画を解析しているのかもしれない。

 面白い傾向としては、画面に字幕が出ていると、その内容がそのままテキストに反映されることだ。おそらく画面内に文字情報があれば、テキスト化にあたって優先的に採用するロジックなのだろう。ただし字幕が必ずしも画面に映っている内容を表しているわけではないため、結果的に唐突かつ意味不明なテキストが表示されることも多く、こちらも実用性は低い。そもそも画像と照合せずに出力している時点でマイナスだろう。

 ともあれ、これら機能の本来あるべき姿は、モーションを検知した時に、そのモーションについての情報、つまり「モーションを検知した瞬間の映像」から「通常時の映像」を引いた差分の情報をテキスト化してくれることだろう。しかし現状では「通常時の映像」しか提供してくれないので、監視カメラに搭載する機能としては期待外れだ。

 このあたり、今回試していない別のエージェント(アドオン)であれば、きちんと出力されるのかもしれないが、少なくとも今回見てきた内容では、とてもではないがお勧めできるレベルにはない。前述のTVを使った実験のように、被写体が長時間映る環境であれば、多少なりとも正確にテキスト化される可能性はあるが、そうした生成AIの癖に合わせてユーザーが行動を変えなくてはならないのは本末転倒だ。

●コンセプトに完成度が追いついていない印象 今後の巻き返しに期待

 以上のように、現状のATOM Cam GPTは微妙に評価に困る製品だ。従来のカメラとの比較でいうとナイトビジョンがないこと、画角が狭いことがネックで、さらに防水仕様のATOM Cam Swingと違って設置先が屋内に限られるという問題もある。

 筆者は自宅に設置済みのATOM Cam Swingと「ATOM Cam 2」のどれかと入れ替える予定で購入したが、検討した結果どれの代替にもなり得ないと判断し、本稿執筆時点では宙に浮いてしまっている。

この記事に関連するニュース

トピックスRSS

ランキング

複数ページをまたぐ記事です

記事の最終ページでミッション達成してください