Pythonで画面イメージを取得する

https://www.youtube.com/watch?v=zSwhgP3AznU

GitHub

https://github.com/formazione/utilities

マウスで画像を取得するための非常にシンプルなプログラム。Windowsにも同様のアプリがありますが、これは、コンピューターの画面から画像を取得して使用できるようにするPythonの他のプログラムにも役立つと思いました。特に、画面部分を取得してから、画像からテキストを取得して、テキストエディタで使用できるようにする簡単なスクリプトを作成するつもりでした。

レベル1

GrowHI74点2日前

私は文字通り先週仕事のためにとても似たようなものを作りました。ビデオ会議で会議の参加者の名前を取得する必要があり、画像をOCRに追加する以外は同じ設定を使用し、テキストをリストに取得してからパンダに渡して、予想される参加者と比較し、行方不明者を見つけました。結局、それをCSVとしてGoogleスプレッドシートにプッシュし、会議の誰もが行方不明者を確認できるようにしました。

レベル2

コンベンションリストG14点2日前

いいですね。

レベル2

オリーブタートル8点2日前

参加者名のリストをスクロールするにはどうすればよいですか?仮想イベントに参加しなければならない人として、これは天の恵みのように聞こえます。

レベル3

GrowHI14点2日前

Pyautoguiパッケージ。他の方法では自動化することが不可能かもしれないことを成し遂げるために、よりハッキーなルートを取っている人々にとって、それは間違いなくよく知られています。

レベル4

滝野2点2日前

セレンの方がいいのではないですか?

レベル5

もっともらしい2点2日前

AFAIKセレンはブラウザの自動化により適しています、それが他のものをサポートするかどうかさえわかりません

レベル5

GrowHI1点2日前

使用したことはありませんが、前述のことを聞いたことはあります。これらの操作は非常に基本的なものであるため、画面上の特定のポイントをクリックするか、キーを押すと、1つのパッケージが他のパッケージよりも優れている理由がわかりません。私は間違いなくセレンをチェックします、そしてあなたがその特徴とそれがより良いかもしれない理由について何か情報があれば私はすべての耳です。

レベル3

jacksodus2点2日前

OPではありませんが、どういう意味ですか?

レベル4

オリーブタートル7点2日前

ズームでは、大規模な会議の場合、参加者のリスト全体を一度に表示することはできません。リストを上下にスクロールする必要があります。したがって、1つのスクリーンショットですべての参加者の名前をキャプチャすることはできません。OPがこれに遭遇したかどうか疑問に思いました!

レベル5

jacksodus4点2日前

keyboardライブラリを使用しPage Downボタンの押下を模倣できる場合があります。おそらく、マウスホイールのスクロールダウンを模倣するために同様の何かが存在します。

レベル6

ネイザー6点2日前

PyAutoGUIライブラリにはマウススクロール機能があります

レベル2

dchess6点2日前

Zoom APIを確認してください。複雑さを増す必要なしに、リクエストを介してこれを直接プルできます。

レベル3

GrowHI1点2日前

私はWebExを使用しています。私はいくつかのPythonライブラリを調べましたが、複雑さは私のソリューションよりも高いようでした。

レベル2

ステレオサイク3点2日前

これはカッコいい。しかし、サイトから参加者のリストをスクレイピングすることで、これを他の方法で行うことができるかどうか疑問に思っています(会議がブラウザーで行われたと仮定します)。それができれば、OCRを使用するよりもはるかに簡単で効率的で、さらに正確になると思います。また、この方法では、結果をパンダに渡すのがはるかに簡単になります。

レベル3

GrowHI2点2日前

私はWebExを使用しており、ブラウザセッションがあればアプリケーションに送信されます。間違いなく、美しいスープでデータをWebスクレイピングする方がよかったでしょう。

レベル2

Justwonk1点2日前

私は似たようなことをしようとしましたが、cv2で多くの問題が発生し、tesseract ikを使用して質問することがたくさんありましたが、コードを表示できる可能性があります

レベル3

GrowHI1点2日前

私はこのコードを非常に大まかな形で持っており、oauthログイン情報やその他の個人情報もたくさんあります。私はそれをクリーンアップして、GitHubにスローできるパブリックバージョンを作成することにします。

レベル4

Justwonk1点2日前

Pythonを初めて使用していただき、ありがとうございます。これは苦労しました。

レベル5

GrowHI1点2日前

私は自分自身をすべての取引のジャックであり、誰のマスターでもないと考えています。私がしていることの多くは、グーグルの束に戻ってきます。明らかに私はPython構文とオブジェクト指向設計を理解していますが、現実的には私は誰もが高度なプログラマーと見なすものではありません。私は単に物事を機能させるために必要な時間を費やしています。

レベル2

vanmorrison21点2日前

あなたは本当に際立っています。私もpytesseractを追加するつもりでした(目的はそれでした)、実際、私のブログでこのビデオにリンクされている私の投稿を見ると、私がそれを予期していたことがわかります(それはほんの数行のコードです。素晴らしいです。パンダに渡して比較するアイデア。これが私がPythonが大好きな理由です。投稿はhttps://pythonprogramming.altervista.org/image-grabber-1-0-with-python-final-version/投稿です。tesseractコードはこちらhttps://pythonprogramming.altervista.org/ocr-read-a-text-from-an-image-or-a-photo

レベル1

EngineerSW19955点2日前2日前に編集

私は数ヶ月前にこのようなものを作りました。これは、SnippingToolのように画面の一部を切り取ることができるデスクトップアプリです。画像は処理され、文字認識を実行するためにpytesseractを通過します。これにより、クリップボードにコピーして他の場所に貼り付けるために使用できる文字列が返されます。または、Googleで用語を自動的に検索するように設定することもできます。

「プログラマー向けのSnippingTool」https://link.medium.com/Pi1Hx6DzEabで確認してください。

コード付きの私のgithubは記事にリンクされています。ソースコードを表示したり、アプリをダウンロードしたりできますが、Windowsでのみ機能します。

私はプロのプログラマーではないことに注意してください。これは私が書いた最初のアプリです。

レベル1

DeathDragon70504点2日前

Win + Shift + S

レベル2

peterlravn3点2日前

ええ、でもPythonは自動化がすべてではありませんか?毎分スクリーンショットを撮りたいと思ったら、それはかなり面倒です。

レベル3

DeathDragon70501点2日前

非常に真実ですが、このようなスクリーンショットを撮る必要があるほとんどの人は、あなたが言ったように毎分か何かをする必要がない限り、ショートカットを使用するとおそらく良いでしょう。

レベル2

vanmorrison22点2日前

私は知っていますが、これは、Win + Shift + Sを使用して画像を保存し、pytesseractでスクリプトを開始することなく、画像のテキストを取得した後に自動的にOCRすることを目的としていました…また、Winを模倣することも目的としていますちなみに+ shift + s

レベル3

DeathDragon70502点2日前

スクリーンショットを自動的に撮る必要がない限り、ショートカットはより簡単なソリューションIMOになります。それは確かにクールなプロジェクトです。

レベル4

vanmorrison21点1日前

ありがとう

レベル1

SandroSusta2点2日前

それは素晴らしいプロジェクトです

レベル2

vanmorrison21点1日前

ありがとう

レベル1

TheLadyThatLurks2点2日前

これはすごいクールです!

レベル2

vanmorrison22点2日前

ありがとう

レベル1

RawTuna2点2日前

とてもかっこいい。これがPyAutoGuiとかなりうまく統合されているのを見ることができました。

レベル2

vanmorrison22点2日前

おかげで、私はそれを使って、pytesseractで画面のつかんだ部分をテキストに変換するつもりでした

レベル3

RawTuna2点2日前

それは素晴らしい考えです。

以前のコメントでもっと明確にすべきだった。これは、自動化/ RPAを目標とするPyAutoGUIで役立つことがわかります。これは、たとえば、プロセスの一部として押す必要があるボタンの画像をキャプチャするための入力として使用できます。ちょっと考えて…私はまだほとんど初心者です!

レベル4

vanmorrison21点1日前

PyAutoGuiについては、マウスのクリックをシミュレートするなど、画面上で実行できるアクションを自動化するために使用できるという事実を除けば、あまり知りません。もっと知りたいのですが…

レベル5

RawTuna2点23時間前

これは、Pythonに興味を持ったときに最初に出会ったことの1つです。まず、甥がゲームでポイントを獲得するのに役立つオートクリッカーを欲しがっていたので、その方法を考えました。その後、私が働いている会社がタスクの自動化にBlue Prismを使い始めたことを知り、もう少し調査を始めました。IDのリスト(csvから)を読み取り、各値をコピーし、アプリケーションのフィールドに貼り付けて検索し、画面にある条件に基づいて特定のボタンをクリックする、非常に単純なスクリプトを作成しました。

https://pyautogui.readthedocs.io/en/latest/index.html

レベル6

vanmorrison21点19時間前

ありがとう

レベル1

Jgod-ok2点2日前

それはクールだ

レベル2

vanmorrison21点2日前

ありがとう

レベル1

13731101Reddit2点2日前

共有してくれてありがとう😊

レベル2

vanmorrison21点2日前

ありがとう、どういたしまして

レベル1

schlopp960点2日前2日前に編集

よくやった!私は最初の「長めの」用語プログラムの最初のバージョンをアップロードしました。それは、15万を超えるランダムに生成された単語とフレーズを含む辞書から、事前に選択された数の単語をランダムに選択し、それらを表示するだけです。ファイルに保存します。保存したファイルを選択する機能など、より多くの機能を実装し、それらを上書き/削除/コピーできるようにしたいです。

私のポイントは、これは、あるWAYより複雑\印象的。真剣に、素晴らしい仕事、これはドープです。

私が彼らのプロジェクトを楽しんだと誰かに言ったことに対してなぜ私が反対票を投じているのか分かりません。初心者が手を差し伸べて学びたいと思うのを難しくしているエリートのdouchebagsのおかげです。

レベル2

vanmorrison21点2日前

ありがとうございました

コメントを残す

メールアドレスが公開されることはありません。

Next Post

独自の画像認識モデルを最大30行のPythonでトレーニングする

火 10月 20 , 2020
https://github.com/australia/aboriginal-flag-cv-model