AIは超サイヤ人の各形態を判別できるか？TensorFlowを使ったらプログラムを1行も書かずにできた！

キュウゾウ

この記事をザックリまとめると、、
・プログラムを1行も書かなくてもAIの画像認識を実行できる方法がある
・試しに超サイヤ人の各形態を画像認識させてみた
・駆け出しAIエンジニアは実行までできたのか？画像認識の精度はどうだった？

「プログラムを1行も書かずに機械学習（画像認識）を体験できる！」という情報をネットで見つけたので、駆け出しAIエンジニアの身として勉強の為にやってみました！

具体的にやってみたことは、

孫悟空の「超サイヤ人、超サイヤ人3、超サイヤ人ゴッド、超サイヤ人ゴッド超サイヤ人」の4種類の画像を各100枚をめどに集める
集めた画像をTensorFlowに学習させる
例えば、上記で使わなかった「超サイヤ人3」の画像を与えてみた時に、上のどの形態と判断するかテストする

ということです！

左から（1）超サイヤ人、（2）超サイヤ人3、（3）超サイヤ人ゴッド[赤髪]、（4）超サイヤ人ゴッド超サイヤ人[青髪]

キュウゾウ

この4つの形態に絞ったのはそれぞれ髪の色、髪型に特徴があるからです。
超サイヤ人2は1と違いがわかりづらいので省いて、GT版に出てくる超サイヤ人4等は判別が複雑になるので省きました！

そして、やってみた感想は、、、

AI初心者には学べることが多かった！
判別の精度はイマイチなので遊びの範囲で

という感じです。

難易度的にはPythonもしくはプログラミングをちょっとかじったことがあれば、Googleで調べながら実行できてしまうレベルだと思います。

初心者の私がつまづいた点もこのページにまとめてますので、エラー時等の参考になれば幸いです。

TensorFlowの準備

今回の画像認識はGoogleが提供しているTensorFlowというライブラリを使います。

ここではインストールについての説明は省きたいので、TensorFlowを使ったことない方はネットで検索して自力でインストールしてみてください！

私の場合、Windows版Anaconda経由でTensorFlowの環境構築をして使っています。

tensorflow-hubも必要

既にTensorFlowが使える状態になっている方でも、tensorflow-hubはインストールされてないかもしれません。

私は入ってなかったので、ターミナルから下記コマンドを実行しました。

コード

pip install tensorflow-hub

TensorFlowのバージョンに注意

この先の実行時の話になりますが、私のTensorFlowバージョン1.4だと実行時にエラーは出ませんでした。

ただ知人のエンジニアがTensorFlow2.0系をインストールして実行したところ、エラーになりました。

1.4まで下げたところエラーが出なくなったので、これからインストールする方は1.4以下を推奨します。

Googleイメージから超サイヤ人の画像を収集

機械学習の画像認識には大量の画像データが必要になるので、まずは画像集めから始めます！

大量と言っても、今回は遊びなので、

超サイヤ人
超サイヤ人3
超サイヤ人ゴッド
超サイヤ人ゴッド超サイヤ人

の画像をそれぞれ100枚をめどに集めてみることにしました。

Googleで検索して1枚1枚手動でダウンロードして集めるのも良いですが、Pythonを使って一気にダウンロードできる方法があるらしいので、今回はそれを真似してやってみました！

ここでもプログラミングは一切不要で、ターミナルからコマンドを実行するだけでした。

さっそく「超サイヤ人」の画像を集める時を例に実行していきたいと思います！

まずはターミナルを開いて下記コマンドを実行、

コード

pip install google_images_download

続いてcdコマンドでダウンロードしたいフォルダに移動して、下記コマンドを実行、

コード

googleimagesdownload -k '超サイヤ人'

すると、上のような感じで超サイヤ人の画像がフォルダにダウンロードされます。

ちなみに、このコマンド1回で100枚の画像をダウンロードしようとしてくれます。

エラーになった分は弾かれますので、今回は92枚の画像がダウンロードできました。

不要な画像を削除したり、精度が上がるように加工した

超サイヤ人の画像をダウンロードしたはずなのに、超サイヤ人ゴッドの画像が混じっていたり同じ画像がダウンロードされていたりするので、不要な画像は削除しました。

また文字（テキスト）が邪魔だったり、他のキャラクターが一緒に入り込んでいる画像も多かったので、画像編集ソフトで切り取りなどして加工しました。

ここは自動化できず人間による手作業が必要で、とても面倒です。

AI時代の新たな労働問題を身をもって体験できたような気がしました。

他の超サイヤ人の形態も同様にして画像収集

コード

googleimagesdownload -k '超サイヤ人3'

のようにして他の超サイヤ人の形態も画像をダウンロードしていきます。

各形態の画像は、それぞれダウンロードするフォルダを分けてあります。

そして、集めた画像を削除・加工していったら、最終的には下記の枚数に落ち着きました。

超サイヤ人：58枚
超サイヤ人3：56枚
超サイヤ人ゴッド：53枚
超サイヤ人ゴッド超サイヤ人：83枚

各100枚をめどに集め始めたのですが、実際はかなり減ってしまいました。

今回は遊びなのでこの枚数で進めていくことにします。

ちなみに、各画像ファイルの名前はダウンロードしたままでOKで、リネームしないでも特に問題ありませんでした。

Githubから2つのファイルをダウンロード

・retrain.py

・label_image.py

上記のリンクをクリックして「Raw」という箇所を右クリックするとダウンロードできます。
ソースを丸々コピペして自分でファイルを作成しても同じです。

キュウゾウ

ダウンロードボタンがなく、Githubのダウンロード方法は初心者にはちょっと難しいですね…

フォルダ構成はこんな感じ

普段TensorFlowを使っているフォルダの配下に、今回用に「charahantei1」というフォルダを作り、その中に、

images
images_test
retrain.py
label_image.py

を置いています。

imagesフォルダの中には下記のように「超サイヤ人の各形態ごとの画像フォルダ」があります。

この画像フォルダ名が日本語だとエラーになるみたいなので、「supersaiyan1」のように半角英数にしています。

「supersaiyan1」フォルダの中には超サイヤ人の画像が58枚入っています。

「images_test」フォルダの中はこの段階では何も入ってなくてOKです！

これで準備は完了です。

retrain.pyを実行して画像データを学習させる

コード


python retrain.py \
  --bottleneck_dir=bottlenecks \
  --how_many_training_steps=200 \
  --model_dir=inception \
  --summaries_dir=training_summaries/basic \
  --output_graph=retrained_graph.pb \
  --output_labels=retrained_labels.txt \
  --image_dir=images

ターミナルを開いて上記コマンドを実行します。

もし画像を置いてあるフォルダ名が私と違うなら、一番下の「images」の部分を変える必要があります。

単項演算子がエラーが出る場合

私の場合windows環境だからか、上のようにコマンドを入力すると「単項演算子 ‘–‘の後に式が存在しません」というエラーが出てしまいました。

コマンドを改行しているのが原因らしく、

コード

python retrain.py --bottleneck_dir=bottlenecks --how_many_training_steps=200 --model_dir=inception --summaries_dir=training_summaries/basic --output_graph=retrained_graph.pb --output_labels=retrained_labels.txt --image_dir=images

のように1行にして実行したら上手くいきました！

エラーもなく実行できたら

この段階で「TensorFlowが超サイヤ人の各形態を、画像認識を使って学習できた」ということになります！

自分が画像認識をやっているなんてテンション上がりますね。

次は本当に学習できているのかを確認する為に、「label_image.py」に超サイヤ人のどれかの形態の画像を1枚送って、「正しく形態を判別できるか？」をテストします。

label_image.pyに超サイヤ人の画像を送って判別させる

コード

python label_image.py  \
  --graph=retrained_graph.pb  \
  --labels=retrained_labels.txt  \
  --output_layer=final_result  \
  --image=images_test/hanbetu1.jpg  \
  --input_layer=Placeholder

images_testフォルダの中にhanbetu1.jpgという超サイヤ人の画像を入れた場合のコマンドです。

先ほどと同じく私の場合エラーが出るので、下記のように改行せずに実行しました。

コード

python label_image.py --graph=retrained_graph.pb --labels=retrained_labels.txt --output_layer=final_result --image=images_test/hanbetu1.jpg --input_layer=Placeholder

判別用の画像について

images_testフォルダの中に入れる判別用の画像は、imagesフォルダの中に入っていない別の画像を用意します。

imagesフォルダの中に入れたのは学習用の画像なので、同じ画像を使ってしまうと精度が良くなってしまう可能性があります。

私たちの身近な例で言うと「練習問題と試験問題が同じ」というような感じです。