どうも、 効率化大好き カズ です。
今回は、Screenpressoの「OCR機能」について、画像付きで解説していきます。
OCRとは
「OCR」は Optical Character Reader の略で、画像データのテキスト部分を認識し、文字データに変換する光学文字認識機能のことです。
結論から言うと、Screenpressoの「OCR機能」は、日本語テキストをがっつり文字起こしするには向いてないです。
ただし、非常に便利だと思うところもあります。
それは、英語表示を「テキスト化→翻訳」がスムーズにできるところです。
この辺の使い方も本文で紹介したいと思います。
Screenpressoの「OCR機能」は有料版のみ使える特別な機能なので、
- 有料版を購入しようか迷っている
- 有料版にしたんだけど、OCRってどうやって使うんだ?
- OCR機能の精度はどんなもんなのか知りたい
という方はぜひ参考にしてください。
※有料版のその他機能については以下の記事に詳しく書いています。
Screenpresso「OCR機能」の使い方
OCR機能の使い方は大きく2パターンあります。
- キャプチャ機能
→ [テキストのコピー(OCR)] - 画像エディタ
→ [画像上のテキストを抜き出す]
さらに、抜き出したテキストの翻訳も可能です。
それぞれ詳しく解説します。
<キャプチャ機能>テキストのコピー(OCR)
キャプチャ機能の一つに[テキストのコピー(OCR)]があります。
これを使えば、デスクトップに表示している「通常コピーできないテキスト」を読み取ることができます。
例えば、警告表示やコピー制限がかかっているテキスト、さらにはYouTubeの動画の中で使われているスライド資料などですね。
テキストのコピー(OCR)を起動する方法は3つ。
- クイックキャプチャウィンドウから起動
- タスクバーのアイコンから起動
- ショートカットキーで起動
ここでは一番わかりやすい「クイックキャプチャウィンドウから起動」で手順を解説していきます。
「テキストのコピー(OCR)」を頻繁に使う場合は、ホットキー登録することをオススメします(ホットキー例:Alt+Q)。
クイックキャプチャウィンドウとは
クイックキャプチャウィンドウは、画面上部にカーソルを合わせると表示される簡易操作窓のことです。
手順
1.クイックキャプチャウィンドウを開き、スクリーンショットの右側にある「▼」をクリック。
2.ドロップダウンメニューの中の[テキストのコピー(OCR)」をクリック。
3.テキストを抜き出したい範囲を選択。
4.抜き出したテキストは「画像上のテキスト」に表示されます。
<画像エディタ>画像上のテキストを抜き出す
画像エディタの中で開いた画像の中のテキストを読み取る機能です。
Screenpressoでキャプチャした画像はもちろん、それ以外の画像(PC内に保存している画像)も読み取り可能です。
例え、
- Kindleをスクショしてテキスト化する
- 紙の本の写真を撮ってテキスト化する
という使い方もできます。
書籍の内容の一部を引用することがある方は、この「OCR機能」は役立つと思います。
「画像上のテキストを抜き出す」の使い方
1.テキストを読み取りたい画像を画像エディタで開く。
2.上部メニューの[画像をコピー]右の[▼]❶ をクリックし[画像上のテキストを抜き出す]❷ を選択。
3.テキストの抜き出しが終わると「画像の抜き出し」ウィンドウが表示されます。
▼
Screenpresso の OCR機能の精度はどうなのか
Screenpresso の OCR機能を「デフォルト」のまま使うと、精度はよくありません。
フォントによっては、まともに読み取らずに文字化けするからです。
試しに、以下のバナー画像読み取ってみましょう。
文字データ化すると、以下のようになりました。
業界最高水準
認識精度98-87%の
AトOCR
・・・惜しい!!
というか、このレベルのフォントでこの精度ですから、すこしクセのあるフォントなら文字化けしまくりでしょうね(汗)
これなんかひどいです。
致命的な違い
セキ4陟イ「・丿
14:26
ス,ド・シ,
という感じで、本格的なOCR機能を求めている方にはオススメできないレベルです。
Screenpresso の OCR機能は「翻訳」が超便利!
フォントによってはうまく文字データ化できないOCR機能ですが、これは便利だなと思うところもあります。
それは、コピーできないテキストを読み取ってすぐに翻訳できるところです。
- ソフトをインストールする際に出てくる英語の説明
- エラー時に表示される英語表示
などを簡単に読み取れます。
例えば、下記のようなエラー表示が出たとします。
OCR機能がないときは、
- エラー表示がでる
- 「Google翻訳」を開く
- 画面を二分割にする
- 表示されている英語の文章を見ながら打ち込む(これがめんどくさい…)
- 翻訳した内容を読む
という手順が必要でした。
これが、
- エラー表示が出る
- エラー表示をキャプチャする
- 翻訳ボタンを押す
- 翻訳した内容を読む
という感じで、テキストを打ち込むことなく翻訳できるようになります。
▼
見てわかるように、何が書いてあるのかはだいたい理解できますよね。
え?・・・わからない?
そうですよね…。
これがWindowsのOCRの限界なので仕方ないです。
<追伸>
これを解決する方法がありました。
それは、道具をWindows→Tesseractに変更するだけです。
OCRの精度を上げる手順
デフォルトはWindowsのOCRを使っているみたいなので、精度はあまりよくありません。
これをサードパーティ製(Tesseract)に変更することで、精度が上がります。
「Tesseract」は、Google社が開発しているオープンソースの光学式文字認識ソフトウェアです。
1.画像上のテキストエディタの「道具」を[Windows]→[Tesseract]に変更する。
2.「追加の外部ソフトウェアが必要です」と出てくるので[今すぐダウンロードしてインストールします]をクリック。
3.インストールが終わると、今まで[ja]しかなかった言語が 8種類に増えています。
日本語を読み取るなら[jpn]
英語表記なら[eng]
その他、フランス語(fra)・イタリア語(ita)・スペイン語(spa)なども選べるようになっています。
特に英語表記の読み取り精度が上がります。
先ほど読み取ったエラー表示で試してみたのが以下です。
読み取り後
日本語に翻訳
このように、英語の読み取り精度が上がれば翻訳したときにわかりやすくなります。
OCRを使うときはぜひこの設定で使ってみてください。
まとめ
今回は、Screenpressoの「OCR機能」の使い方について解説しました。
まとめると、
<OCR機能の使い方は大きく2パターン>
- [テキストのコピー(OCR)]
- クイックキャプチャウィンドウから起動
- タスクバーのアイコンから起動
- ショートカットキーで起動
- [画像上のテキストを抜き出す]
- OCR機能の精度はあまり良くない(フォントによる)
- コピーできないテキストを読み取ってすぐに翻訳できるところが◎
というところですね。
結論としては、「オマケ」として考えると、非常に便利な機能だと思います。
ただ、がっつりOCR機能を使いたいのであれば専用のソフトを使ったほうがいいですね。
ちなみに私は、AutoCADなどのアプリ内で「コピーできない要素」を文字データ化しています。
役割がわからない「英語表記の項目」がけっこうあるので、「テキスト化してコピー→検索して使い方を調べる」ということをよくします。
そう考えると、私にとってはめっちゃありがたい機能です♪
※有料版にアップグレードする場合は、以下の手順を参考にしてください。