使い方

画像・スクリーンショットから文字を抽出する方法|Windowsで使えるOCRの選び方(2026年版)

Windowsでスクリーンショットから文字をOCRで抽出している画面

画面のすぐそこに文字があります——スクリーンショット、ホワイトボードを撮った写真、スキャンした書類、誰かが画像で送ってきたレシピ。目で読むことはできます。ところが、いざコピーしようとすると何も起きません。文字は画像の中に閉じ込められていて、Windowsはそれを「読める言葉」ではなく「ひとかたまりの画素(ピクセル)」として扱うからです。

これは「とっくに解決していてもよさそうなのに」と感じる、日常のちょっとした不便の一つです。写真からスマホに植物の名前を教えてもらえる時代なのに、スクリーンショットから電話番号をコピーするだけのことに、手で打ち直すか、適切なツールを探すかの手間がかかります。

これを解決する技術がOCR(光学文字認識)です。登場してから何十年も経つ技術ですが、ここ数年で精度が劇的に向上しました。問題は「使えるかどうか」ではなく(もちろん使えます)、「あなたの目的にどの方法が合うか」です。

結論から先に: Windowsには画像から文字を抽出する標準機能がいくつかありますが、機能は限定的で、しかも見つけにくいのが実情です。スクリーンショット・写真・スキャン文書から確実に文字を抜き出したいなら、Microsoft Storeの OCR Text Recognition Tool のような専用OCRアプリが、ほとんど設定なしで仕事をこなします——画像を開く、文字を抽出する、コピーする、それだけです。たまに使う程度なら、Windows標準のSnipping Tool(旧称:切り取り&スケッチ)のテキスト抽出や、PowerToysのText Extractorも覚えておく価値があります。


OCRが実際にやっていること

OCRとは、画像を解析してそこに写っている文字を識別し、選択・コピー・編集できるテキストへ変換する処理のことです。大まかに言えば、ソフトが画像内の形を見て、既知の文字パターンと照合し、「各文字が何か」の最有力候補を出力します。

最近のOCRは、単純なパターン照合をはるかに超えています。現在のエンジンは文脈を理解する機械学習モデルを使っており、たとえばあるフォントでは「rn」が「m」とほとんど見分けがつかないことを知ったうえで、前後の単語からどちらなのかを判断します。傾いた文字、ムラのある照明、(程度の差はあれ)手書き文字、同じページ内の複数言語にも対応できます。

精度は、いくつかの要因に左右されます。元画像がどれだけ鮮明か、文字にどんなフォントが使われているか、印刷文字か手書きか、画像にどれくらい視覚的なノイズが含まれているか。書類をきれいに撮ったスクリーンショットならほぼ完璧に変換できますが、暗い場所で撮ったしわくちゃのレシートのぼやけた写真は、ずっと難しい課題になります。


📊 WindowsのOCR方法を比較

方法 費用 向いている用途 多言語対応
OCR Text Recognition Tool 無料枠あり/以降は手頃な有料プラン 多言語対応で、日常的に安定して文字を抽出したい あり
Snipping Tool(Windows標準) Windowsに標準搭載 画面に見えている文字をすばやく取りたい あり(言語パック依存)
PowerToys Text Extractor 無料 すでにPowerToysを使っている人の単発抽出 限定的
OneNoteのOCR Microsoftアカウントで無料 すでにMicrosoft環境を使っている人 あり
Adobe Acrobat Pro 月額の有料サブスク スキャンPDF文書のプロ向けOCR あり

こういう場面で必要になる

ツールの話に入る前に、よくある場面を押さえておくと役立ちます。文字抽出を探す理由は人によって驚くほど違い、最適な方法は「どの状況か」によって変わるからです。

エラーメッセージやコードのスクリーンショット。 同僚から不具合のスクリーンショットが送られてくる。エラー文を検索したり、チケットに貼り付けたりしたい。スタックトレースを1文字ずつ打ち直すのは面倒でミスも出ます。OCRなら、その文字を数秒で正確に抜き出せます。

スキャンした書類。 スキャンした契約書、レシートの写真、各ページが実は画像だけのPDF。画面では普通の文字に見えるのに、何も選択できない。OCRは、その画像を、コピーも検索もできる本物のテキストに変えてくれます。

印刷物を撮った写真。 本のページ、会議後のホワイトボード、栄養成分表示、外国語の道路標識。文字を写真に撮れてもデジタルで選択できない——そんなときはいつでも、OCRが橋渡しになります。

画像に閉じ込められたデータ。 表計算ファイルではなくスクリーンショットで表を送られた。参照したいラベルがグラフに付いている。引用したい文章がスライドに載っている。どれも、元ファイルではなく画像から文字を抽出する必要があります。

外国語の文字。 読めない言語の文字が入った画像がある。画像から直接翻訳しようとするより、まず文字を抽出してから翻訳する方が確実です。翻訳ツールは、きれいなテキスト入力の方がうまく働くからです。


方法1:Windows標準のSnipping Tool

Windows 11では、標準の Snipping Tool(旧称:切り取り&スケッチ) 自体にテキスト抽出(OCR)が組み込まれています。追加インストールは不要で、すでにパソコンに入っています。Win + Shift + S を押して取り込みたい範囲を選び、撮ったキャプチャを開いたら、ツールバーの「テキストアクション」を選ぶだけです。画像内の文字が認識され、必要な部分を「テキストをコピーする」でクリップボードへ送れます。

標準フォントで明るくはっきりした文字なら、十分に実用的です。メールアドレスや電話番号など、個人情報をその場で黒塗りできる機能もあります。一方で、認識した内容を細かく整える、まとめて大量の画像を処理する、複数言語を同時に扱う、といった用途には物足りません。認識精度はWindowsに入っている言語パックにも左右されます。

「画面に見えている文字をひとまずサッと取りたい」という普段使いには、追加ソフトなしで使えるこの方法がいちばん手軽です。ただ、もう少し踏み込んだ処理になると限界を感じます。


方法2:PowerToys Text Extractor

Microsoft PowerToys は、Windows向けの無料ユーティリティ集で、その中の Text Extractor が基本的なOCRを担当します。すでにPowerToysを入れているなら、すぐに使えます。Win + Shift + T を押し、抽出したい文字を四角で囲むだけ。認識された文字は、そのままクリップボードへ送られます。

きれいで明るい標準言語の文字には、よく機能します。物足りないのは、複雑な画像、複数言語が混在する内容、処理をもっと細かく制御したい場面です。何を認識したかのプレビューがなく、コピー前に誤りを直すこともできず、対応言語はWindowsに入れたOCR言語パックに依存します。

スクリーンショットから1行抜き出す、画像から住所をコピーする——そんな手早い単発の用途には、思いのほか便利です。それ以上に踏み込むと、やはり限界を感じます。

PowerToysを入れていない場合は、Microsoft StoreまたはGitHubから入手できます。インストールは簡単ですが、OCR機能だけでなくPowerToys一式が入る点は知っておきましょう。


方法3:専用のOCRアプリ

文字抽出を「たまに」以上の頻度で行うなら、専用のOCRアプリの方が現実的です。流れがシンプルで、画像を開いて抽出をクリックすれば、認識された文字がコピーできる状態で表示されます。覚えるべきショートカットも、画面上で選択範囲を描く手間も、どこかに貼り付けるまで成功したか分からないもどかしさもありません。

専用アプリは、難しいケースもうまくこなす傾向があります。複数言語が混ざった画像、変な角度の文字、画質の低い写真、背景にノイズが乗ったスキャン文書など。OCRの処理パイプラインそのものに開発リソースを集中しているため、難しい入力での精度に差が出ます。

OCRアプリの中には、クラウド上の認識エンジンで画像を処理するものもあります。これは現実的な設計判断です。クラウドのエンジンは桁違いに大きなデータで学習されており、特に手書き、珍しいフォント、ラテン文字以外の文字(日本語・中国語・韓国語など)で精度が高くなりがちです。トレードオフは、処理のあいだ画像が一時的に端末の外へ出ること。スクリーンショットから文字を抜く、スキャンしたレシートを読む、といった大半の用途では気にする必要はありませんが、機密情報を扱うなら知っておく価値があります。

ここに当てはまるのが OCR Text Recognition Tool です。画像を開き、抽出し、コピーする——その流れに無駄がなく、多言語にも対応しています。なお、保存済みの画像ファイルではなく「いま画面に表示されている範囲」だけをサッと取りたいなら、範囲を選ぶだけで文字を抜き出せる Screenie のような画面OCRが便利です。PDF全体を変換する必要がなく、短い文章や表の一部だけを取りたいときに向いています。


方法4:OneNoteの隠れたOCR機能

OneNoteにはOCRが組み込まれていますが、目立ちません。OneNoteのページに画像を貼り付けるか挿入したら、それを右クリックして「画像からテキストをコピー」を選びます。OneNoteが画像を処理し、認識した文字をクリップボードへコピーします。

きれいな画像や印刷文字なら、精度はまずまずです。難点は手順の多さです。OneNoteを開き、ページを作る(または移動する)、画像を挿入する、処理を少し待つ、それから右クリックする——という流れ。ほかの用途でもOneNoteを使っているなら気の利いた小ワザですが、そうでないなら、文字を抜くためだけにノートアプリを開くのは遠回りに感じます。

もう一つのクセ:OneNoteは画像を処理するのに数秒かかることがあり、その間は「画像からテキストをコピー」が出てきません。挿入直後に右クリックすると、まだ項目が現れていないことがあります。


OCRの精度を左右するもの

どのツールを使っても、すべての画像が同じ結果になるわけではありません。要因を理解しておくと、期待値を適切に持てますし、可能なときは抽出前に元画像を改善できます。

解像度は大事。 解像度が高い画像ほど、OCRの結果は良くなります。300dpiのスキャンならほぼ完璧に変換できますが、小さな文字のかたまりを72dpiで撮ったスクリーンショットは誤認識が出ることがあります。元データを自分で用意できるなら、できるだけ高い解像度で取り込みましょう。

色よりもコントラストが大事。 OCRエンジンは内部で画像を高コントラストに変換してから処理します。白地に黒文字がいちばん良い結果になります。薄いグレーの背景に少し薄いグレーの文字——人の目には問題なく見えても、コントラスト比が低すぎてエンジンが混乱することがあります。

まっすぐな文字は、傾いた文字より簡単。 ページを撮るなら、斜めからではなく真正面から撮るようにしましょう。最近のOCRはある程度の傾きに対応できますが、回転が増えるほど精度はわずかに落ちます。スキャンするなら、スマホのカメラよりフラットベッドスキャナーの方がきれいな結果になります。

印刷文字か手書きか。 標準的なフォントの印刷文字は非常に正確に変換できます(きれいな画像なら99%超)。手書き認識は大きく進歩しましたが、依然ばらつきがあります。整った一定の手書きならそれなりに読めますが、乱雑な字や癖の強い書き方は、どのOCRエンジンにとっても難しいままです。

ノイズや汚れ。 染み、コーヒーの跡、折りじわ、圧縮による劣化は、いずれも精度を下げます。特にJPEGの圧縮は文字の輪郭をわずかにぼかし、誤認識を招くことがあります。元が強く圧縮された画像だと、OCRエンジンが使える手がかりが少なくなります。


スキャンしたPDFへの対処

文字抽出の問題には、「スキャンしたPDF」という特有のパターンがあります。各ページが実は写真になっているPDFのことです。表示すると普通の文字に見えるのに、選択しようとしても何もハイライトされません。PDFビューアーが各ページを1枚の画像として扱っているのです。

PDFがスキャンかテキストかを見分けるには、開いて単語をクリック&ドラッグで選択してみてください。単語を1つずつハイライトできればテキストベースで、OCRは不要——そのままコピーできます。何もハイライトされない、またはページ全体が一塊として選択されるなら、スキャンです。

スキャンPDFへの対応は、画像と同じです。OCRをかけます。PDFファイルをそのまま受け取り、各ページを画像として処理できるOCRツールもあれば、先にPDFのページを画像へ変換する必要があるものもあります。いずれにせよ、結果として抽出可能なテキストが得られます。

文字を埋め込んだPDF形式(他の人も検索・選択できる状態)に戻したい場合は、「検索可能なPDF」を作れるツールが必要です。これは、見た目を保ったまま文字を選択できるよう、画像の背後にOCRした文字レイヤーを重ねたものです。Adobe Acrobatはこれが得意で、専用OCRツールの一部にも同様の機能があります。ごく短い箇所だけ抜き出したいときは、PDFの文字がコピーできないときの対処法 のガイドもあわせてご覧ください。


トラブルシューティング

抽出した文字に誤りが多い。 元画像が低解像度・低コントラストか、珍しいフォントを含んでいる可能性が高いです。まず画像を改善してみましょう——コントラストを上げる、文字の部分だけにトリミングする、より高い解像度でスキャンし直す。

文字が変な順番で出てくる。 多段組みのレイアウトや複雑なページ構成は、OCRエンジンが読む順序を取り違える原因になります。文字は抽出できているのに段落がばらばらなら、一度に抽出する範囲を小さくしてみてください——1段ずつ、1ブロックずつ、1段落ずつ。

特殊な記号や符号が間違う。 OCRエンジンは標準的なアルファベット・かな漢字をいちばん得意とします。数式記号、通貨記号、特殊な約物は認識が難しく、別の文字に化けることがあります。これらは丁寧に校正してください。

ラテン文字以外の精度が低い。 日本語・中国語・韓国語・アラビア語など、ラテン文字以外のOCRは向上していますが、ラテン文字の認識より精度が落ちるのが一般的です。使うOCRツールがその言語に対応しているか、必要な言語パックが入っているかを確認しましょう。

手書きがまったく認識されない。 すべてのOCRエンジンが手書きに対応しているわけではありません。対応していても、たいていは、かなり整った一定の字であることが前提です。手書きメモを日常的にデジタル化したいなら、手書き認識を明記しているツールを探してください。


よくある質問(FAQ)

Windowsは標準で画像から文字を抽出できますか?

できます。Windows 11のSnipping Tool(旧称:切り取り&スケッチ)にテキスト抽出(OCR)が組み込まれており、Win + Shift + S で範囲を取り込んでから文字を抽出できます。PowerToysを入れればText Extractorも使え、OneNoteにも隠れたOCR機能があります。ただし、いずれもワンクリックで完結する万能の手段ではありません。

OCRは校正なしで信用できるほど正確ですか?

きれいで高解像度の印刷文字なら、精度はおおむね99%超です。画質の低い画像、手書き、珍しいフォントでは、必ず校正してください。重要な書類では、OCRの出力が完璧だと決めつけないことが大切です。

スマホで撮った写真からも文字を抽出できますか?

できます。精度は写真の画質しだいです。明るい照明、安定したピント、真正面からの角度がいちばん良い結果になります。ぼやけた写真や斜めの写真は誤りが増えます。

OCRは手書きにも対応しますか?

ある程度は対応します。一般的な文字種で整った一定の手書きなら、それなりの精度で認識できます。乱雑な字、珍しい書体、強く装飾した文字は、どのOCRツールにとっても難しいままです。

動画やライブ画面から文字を抽出できますか?

直接はできません。抽出したい文字が映っているコマのスクリーンショットを撮り、その画像にOCRをかける形になります。画面キャプチャツールの中には、この用途のためにコマを静止できるものもあります。

複数の言語が混ざった文字はどうですか?

最近のOCRツールは数十の言語に対応しています。1枚の画像に複数言語が含まれる場合、自動で処理するツールもあれば、あらかじめ言語を指定する必要があるツールもあります。多言語対応は、専用OCRツールが標準機能より優れる傾向のある領域の一つです。


参考リンク


まとめ

画像から文字を抽出するのは、すでに解決済みの問題です——ツールはそろっていて、精度は高く、処理も速い。本当に考えるべきは、「どれくらいの頻度で必要か」と「どこまで快適な操作を求めるか」だけです。たまにサッと取るだけならWindows標準のSnipping Tool(旧称:切り取り&スケッチ)やPowerToysで十分。すでにOneNoteを使っているなら、その隠れた機能も役立ちます。そして、保存済みの画像やスキャン文書から日常的に、しかも多言語で確実に抽出したいなら、OCR Text Recognition Tool が、無駄のない流れで仕事をこなします——画像を開く、抽出する、コピーする。画面に見えている範囲だけを素早く取りたいなら Screenie が実用的です。

どれを選ぶにせよ、スクリーンショットの文字を手で打ち直すのは、もうやめましょう。人生はそれには短すぎます。