KDEのスクリーンショットツールであるSpectacleを使ってテキストを抽出する方法は次のとおりです。

  • SpectacleはPlasma 6.6からテキストを抽出できますが、デフォルトではそうではありません。
  • Tesseract OCRパッケージをインストールする必要があります。

Spectacleでテキストを抽出する

昨年2月以来、 プラズマ6.6, ショー スクリーンショットからテキストを抽出できます。この機能は光学文字認識(OCR)と呼ばれています。ただし、デフォルトでは有効になっていないため、最新バージョン(現在のPlasma 6.6.5)にアップデートしてもオプションが表示されない理由が気になるかもしれません。

理由は簡単です。必要なパッケージが不足しているからです。これは、QRコードをスキャンしてWi-Fiネットワークにアクセスする場合にも発生しますが、それは別の記事で説明します。ここでは、その理由を説明します。 OCRサポートを有効にする方法 Spectacleでは、Plasma 6.6以降を使用している限り可能です。

Plasma 6.6以降を使用している場合は、SpectacleでOCRサポートを有効にしてください。

アップデート後にスクリーンショットを撮ってみると、説明書に記載されているのとは異なり、テキストを抽出するオプションが表示されないことがわかります。 リリースノート参考動画もあります。

Spectacleを開いて設定画面を開くと、OCRのセクションに「i」のアイコンがあり、そこから詳細情報を確認できます。しかし、そこには単に「利用できません」と表示されるだけです。

OCRは利用できません

Spectacleはインターフェースを使ってテキストを抽出することはできますが、その魔法は... Tesseract OCRこれは、Linux ベースのシステムで使用されるソフトウェアではよくあることです。多くのプログラムは フロントエンドしかし、それらは何かに依存している バックエンド 彼に仕事を任せよう。

前のスクリーンショットのメッセージを消してOCRオプションに置き換えるには、必要なTesseractパッケージをインストールする必要があります。私の場合は、ManjaroのようなArchベースのディストリビューションなので、必要なパッケージは次のとおりです。

  • 遺言
  • tesseract-data-osd
  • テッセラクト・データ・キャット
  • テッセラクトデータ英語
  • tesseract-data-spa

Tesseractパッケージ

上記のパッケージのうち、-cat、-eng、-spaで終わるものが、私が検出させたい言語です(私はスペイン東部出身なのでカタルーニャ語、英語、スペイン語)。 遺言 これはメインパッケージであり、末尾の「-osd」によってソフトウェアは書き込み方向を検出できるようになり、理論的には、例えば90度回転したテキストでも検出できるようになります。

言うまでもないことですが、念のため改めて述べておきます。もし他の言語が必要な場合は、それぞれの言語に対応したパッケージをインストールすれば良いのです。例えば、イタリア語の場合は末尾に「-ita」、フランス語の場合は「-fra」、ロシア語の場合は「-rus」を付けます。

必要なものをインストールする

異なるディストリビューションへのインストール方法は、それぞれのディストリビューションによって異なります。Manjaro の場合は、Pamac (グラフィカルなパッケージ管理ツール) でインストールできますが、 sudo pacman -S tesseract tesseract-data-osd tesseract-data-cat tesseract-data-eng tesseract-data-spaDebianやopenSUSEをベースとしたディストリビューションなどでは、パッケージ名はtesseract-ocrとなる場合があります。

パッケージをインストールすると、ヘッダーのスクリーンショットやKDEチュートリアルビデオに示されているように、スクリーンショットを撮るオプションが表示されます。「テキストを抽出」をクリックすると、テキストをクリップボードにコピーしたり、テキストエディタで開いたりできる通知が表示されます。

注:設定から言語を有効にする必要があります

このオプションが利用可能になると、設定も変更されます。利用不可を示すメッセージは、「テキスト認識(OCR)」セクションに置き換えられます。このセクションは、次の2つの部分のみで構成されています。

  • 言語選択:チェックボックスを使用します。テキストを抽出したい言語を選択します。また、インストールされている言語とサポートされている言語を確認するのにも役立ちます。
  • 抽出後に閉じると、自動保存が無効になります。これは個人の好みですが、私はチェックを外しています。こうすることで、常にクリップボードにコピーされるようになります。

手順は簡単ですが、デフォルトでは有効になっていません。いくつかのパッケージをインストールすることで、Spectacle は「読み取り」できるようになります。