OCRでPDFからデータを抽出 [Power Automate Desktop]

Поделиться
HTML-код
  • Опубликовано: 6 янв 2025

Комментарии • 37

  • @must_it
    @must_it  2 года назад +1

    2022/10/22
    アカウント移行により私のコメントが全て消えてしまいました。
    返信は100%しておりますので、お気軽に質問等コメント下さい!

  • @タートルトータス
    @タートルトータス 3 года назад +2

    ただ操作を調べるだけなら他にいくらでもありますが、こうやって研究した結果をたっぷり見せてもらえる場所は珍しいです。
    助かります!

  • @K.1496-i2p
    @K.1496-i2p 3 года назад +1

    わかりやすかったです。
    ありがとうございます!

  • @ちびねこ-h6x
    @ちびねこ-h6x Год назад

    テキスト抽出をしテキスト分割するとtxtlistができ #とアイテムと表示されますが アイテムから#の番号を逆引きで求めることはできますか?

    • @must_it
      @must_it  Год назад

      可能です。
      ①Loop
      開始値:0
      終了:%TextList.Count - 1%
      増分:1
        ②If
        最初のオペランド:検索したい値
        演算子:と等しい(=)
        2番目のオペランド:%TextList[LoopIndex]%
          ③ループを抜ける
        ④End(If)
      ⑤End(Loop)
      LoopIndexの値が求めたい番号になっているはずです。

  • @智明澤田
    @智明澤田 6 месяцев назад +1

    読み取った商品名や金額はのデータどこに保存されるのですか?または、保存用のファイルを用意しておいて、そこに保存する設定が必要なのですか?枚数が少ない時はいいのですが、多い時はテキストやExcelに保存したいです。

    • @must_it
      @must_it  6 месяцев назад

      読み取ったデータはPAD内の変数に保存されるため、Excel等に書き出す処理が必要になります。
      下記動画が参考になると思います。
      ■OCRで複数ページのPDFからExcelへデータ抽出
      ruclips.net/video/wPIszT-ZUiM/видео.html

  • @VitaQ-g9r
    @VitaQ-g9r 3 года назад

    すごく参考になりました。
    この動画を参考にさせていただきながらフォルダに入っている複数のPDF ファイルからそれぞれOCRで明細を抽出し、その明細のファイル名にリネームするフローに挑戦してみます。

  • @GG-fu8ws
    @GG-fu8ws 3 года назад +2

    解説が分かりやすくて助かります。
    明細が1行なんて実務ではまずありえないので、全ての明細データを取得する方法を知りたいです。
    宜しくお願いいたします。

  • @藤田真治-u1q
    @藤田真治-u1q Год назад

    マストさん
    RPAに挑戦しており、参考にさせていただいています!
    途中まではうまくいっていたのですが、「メインウィンドウハンドルを取得できません」というエラーが出て進めなくなりました。
    なにか解決方法があれば教えてください

    • @must_it
      @must_it  Год назад

      ご視聴ありがとうございます!
      PDFを表示しているアプリケーションは何でしょうか?
      また、どのアクションでエラーが発生しておりますでしょうか?
      PDFをAcrobatで表示している場合は、既にAcrobatが起動していると、「アプリケーションの実行」でエラーが発生します。

  • @yokoinoue4023
    @yokoinoue4023 Год назад

    とっても分かりやすいです。が、どうしてもocrを使ってテキストを抽出できませんと表示されます
    方法はないでしょうか。。

    • @must_it
      @must_it  Год назад

      ご視聴ありがとうございます!
      まずは下記動画をご参考にして頂ければと思います。
      ■OCRのコツ
      ruclips.net/user/livePMtQZDLeur4
      それでも上手くいかない場合は、私に対象のデータをお送り頂けるのであれば確認します。
      ただ、おそらく機密情報で難しいですよね…。

    • @yokoinoue4023
      @yokoinoue4023 Год назад

      @@must_it ご連絡ありがとうございます。動画確認しやってみました!何とか出来たので、フォルダーごと読み取ってループ機能とかを付け足していったら、また、同じ問題がでてきました。くやしいー。

    • @must_it
      @must_it  Год назад +1

      一応出来たとの事よかったです!
      あとは、拡大や縮小など色々試してみるしかないかと思います。
      OCRは地道な調整が必要になるのです…。
      読み取り元のデータにもよりますが、場合によっては、読み取れなかったら、少し調整して再度読み取りを実行するみたいな処理が必要かもしれません。

  • @ちびねこ-h6x
    @ちびねこ-h6x Год назад

    Power Automate Desktopをインストールしてフローを登録して終了して次に起動させると
    コンピューターに設定するというのが表示されます
    設定しようとすると有償版にするよう表示されます
    無償版はこの設定はできないのでしょうか?

    • @must_it
      @must_it  Год назад

      私の方では表示されたことがないのでわかりません。
      予想ですが、クラウドからデスクトップ版のフローを呼び出す際にマシンの登録が必要なのですが、
      それを設定しようとしているのかなと思われます。
      これは有償版の機能のため、無償版はできないと思われます。

    • @ちびねこ-h6x
      @ちびねこ-h6x Год назад

      @@must_it 無償版をインストールしても同じで それが出るたびに再インストールをしています
      マストさんがinstallしている無償版はでないとのことですがクラウドからデスクトップ版のフローを呼び出す設定はしていません
      PCにフローは保存しているつもりなのですが 設定がひつようなのでしょうか

    • @must_it
      @must_it  Год назад

      おそらく会社のMicrosoftアカウントでログインされていると思いますが、
      別の無料のMicrosoftアカウントに切り替えてみてください。
      「Power Automate Desktop」画面の右上の名前のところから、サインアウトすることができます。

  • @中野和世-e5d
    @中野和世-e5d 11 месяцев назад

    はじめまして。
    マストさんの動画を参考にさせていただきながら、業務効率化に励んでいるところです。
    今、PDFからExcelへ転記するPowerAutomateDesktopを作成しているのですが、チェックボックスの反映方法が分かりません。
    いろいろ調べてみたのですが、解決方法が未だ見つかりません。
    よろしければアドバイスいただけませんでしょうか?
    お忙しいところ申し訳ございませんが、よろしくお願い致します。

    • @must_it
      @must_it  11 месяцев назад

      ご視聴ありががとうございます!
      あまり調べられておりませんが、Excel上のチェックボックスをPADから操作するのは難しいように思います。
      UI要素で追加してもイメージとして認識されますし、キー操作でもどのチェックボックスを操作するのかの判定が難しいと思います。
      一つのチェックボックスの操作であれば、特定の座標に対してマウスクリックなどは可能ですが…。

    • @中野和世-e5d
      @中野和世-e5d 11 месяцев назад

      早速ご返信いただきまして、ありがとうございます。そうですよね、、ちょっと難しい気がしますよね。
      そもそものフローをもっと抜本的に改善できればいいのですが……
      ありがとうございました!
      これからも頑張ってください。

  • @nakamura124
    @nakamura124 Год назад

    金額の下の罫線が近すぎてうまく数字を認識できません。何かうまい回避方法はありませんでしょうか・・・?

    • @must_it
      @must_it  Год назад

      書類によっては近かったり重なったりするものがありますよね…。
      私も色々試したことがありますが、そういった場合はかなり厳しいです。
      下記の動画でご紹介しているようにズームにして読み取れるか試すぐらいですね。
      ■OCRのコツ
      ruclips.net/user/livePMtQZDLeur4
      あとは、OCRを使用せずに文字列を解析して読み取ることも書類によっては可能ですので、是非お試しください!
      ■OCRを使用せずにPDFからデータを抽出
      ruclips.net/video/ZLnirksItrc/видео.html

  • @cocorolay484
    @cocorolay484 3 года назад

    わかりやすくて良かったです。OCRで読みとった内容をメッセージ表示の代わりにExcelに転記でやってみたいです。

    • @cocorolay484
      @cocorolay484 3 года назад +1

      @@must_it PADのTesseractのアクションが削除されましたね。この動画のフローに影響ありますか?

    • @cocorolay484
      @cocorolay484 3 года назад

      @@must_it お返事ありがとうございます。影響ないとの事、良かったです。

  • @小林-r7c
    @小林-r7c 3 года назад

    画像記録がオフのままだと、アクションは普通に追加されます。
    ご教授頂きありがとうございます!
    また、デスクトップレコーダー以外だと、pdf画像を抽出することは難しいでしょうか。

    • @小林-r7c
      @小林-r7c 3 года назад

      @@must_it こちらこそご教授頂き誠にありがとうございます!
      また、失礼いたしました、画像ではなく同じようにpdf文章等をエクセルに転記する他のやり方はございませんか。

    • @小林-r7c
      @小林-r7c 3 года назад

      @@must_it そうなんですね、組み合わせが必要なんですね!
      髪媒体からのスキャンだとそれもかのうですか?

    • @小林-r7c
      @小林-r7c 3 года назад

      @@must_it やってみましたが、読み取りができませんでした。解像度を上げても難しそうでした😓

    • @小林-r7c
      @小林-r7c 3 года назад

      @@must_it ご返信遅くなり申し訳ございません。
      そうですよね。色々ご教授ありがとうございました!!
      他の動画も参考にさせて頂きます!

    • @小林-r7c
      @小林-r7c 3 года назад

      @@must_it 一点ご質問があります。
      やりたい動作は
      ①画像をペイントに貼り付け
      ②画像をピクセル指定して縮小
      ③選択から四角形を選択
      ④マウスで指定した範囲まで選択し、(クリックしたまま)トリミング
      という動作です。
      ③まではできましたが、デスクトップレコーダーを使用しても④ができません。
      良い方法はございますでしょうか?

  • @小林-r7c
    @小林-r7c 3 года назад

    ダウンロードは無料ですか?

    • @小林-r7c
      @小林-r7c 3 года назад

      ご返信ありがとうございます!
      また、デスクトップレコーダーの画像記録で、pdfを読み取りをしようとすると、デスクトップレコーダーが閉じてしまいます。原因等は何が考えられますでしょうか。

    • @小林-r7c
      @小林-r7c 3 года назад

      @@must_it アンカー領域を指定した後です!
      指定後閉じてしまい、最初からになってしまいます😓