“ruby”
へー、知らなかった
“国立国会図書館が公開しているOCRライブラリ、NDLOCR" "現在ver2.1がGithubに公開" "古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識”
これは便利そう。
へー。国会図書館がGitHubにOCRのプログラムコードをあげているの、知らなかった。旧字体や縦書きにも強い、と。今度、和古書で試してみよう。
ちなみに普通の縦書き日本語のOCRだと、何故かiOSアプリの一太郎Padがちょっと意味不明に強い https://apps.apple.com/jp/app/%E4%B8%80%E5%A4%AA%E9%83%8Epad/id1490522571
yomitokuとの比較記事待機案件
OCR?すごい技術にゃ!ボク、字が読めないから助かるにゃ!
bunkoOCRがオススメされてたな。 https://99nyorituryo.hatenablog.com/entry/2023/09/24/020328
国会図書館の話なのに「ライブラリ」が図書館の意味でなく混乱したのだが、ブコメを見る限り他の人はすんなり読めたらしい。さすがはてな。
お、これは税金を使う意味がある機能と開発成果公開
デジタルコレクションの全文検索すごいもんなあ。
すごい、これは自分でもダブルチェックしてみる
日本の近代以前の文字は全く読めないのだけど、史学科の友達に教えてあげよう。
おれも「そこそこ」のマシンが欲しいなと思いました
「日本語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は意外に限られてます」「国立国会図書館が公開しているOCRライブラリ、NDLOCR」一太郎PadやbunkoOCRもきになる
「猿飛佐助」のOCRにチャレンジしたことがあるが全くダメだった。とうとうできるようになったか。
試してみたいけどそこそこのスペックのマシンがない…。性能がいいのか分からんけど取り敢えずGUIフロントエンドがないと普及はしなさそうではある
yomitoku とは別?へー。
廃刊になった地元紙のアーカイブを画像で持っているので試してみたい
国立国会図書館が提供するOCRライブラリ「NDLOCR」をWindows環境で使用する方法についての解説。古い書籍や旧字体に対しても高い認識精度を持っているらしい。
後で試す
そっちの「ライブラリ」か。図書館のライブラリって「力こそパワー」っぽさがあるのに完全に正しい使い方だった。
その点Copilotのphi3、今の所縦書きとか手書きの日本語にめっちゃ弱いのが残念なんだよなぁ。Windows Recallで板書がうまく拾って貰えないんよ
今はどうか分からないけど一太郎PadのOCRエンジンはGoogle Cloud Visionを使っているらしい https://internet.watch.impress.co.jp/docs/news/1222537.html
ScanSnapのデフォルトOCRであんま不自由してない(pdftotextでOCR透明テキストを抜いてローカルのelasticsearchに突っ込んで全文検索してる)けど、どうなのかなこれ。
“無料OCRはGeminiは縦書きに弱い。Github公開の国立国会図書館OCRライブラリは旧字体でも高い精度で認識。NVIDIAのグラボ必要。Dockerコンテナの起動。VSCodeのDocker拡張機能を使うと、作業がかなり楽に”
開発者の青池さんもリポストされてるね https://x.com/blue0620 ご本人から補足つっこみ頂戴したけど、今の次世代デジタルライブラリーの全文テキスト作成にはNDLOCRは使っていないらしい https://x.com/blue0620/status/1671506309081104384
“NDLOCRは、現在ver2.1がGithubに公開されています。古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識してくれます”
どの程度のOCR精度なのかが書いていないけど、自分が試した時には求める品質には及んでいなかった。Macでは…の件はコンテナを使えばいいだけ。
“国立国会図書館が公開しているOCRライブラリ、NDLOCR...このライブラリを試してみました。基本、Githubサイトに書いてある通りなんですが、いくつか注意すべき点をメモ”
GitHubに公開されてるのすばらしい。
Githubサイトにある通り、NVIDIA Driverが、Linuxの場合: 450.36.06以上、Windowsの場合:520.06以上である必要があります。Macでは動かないです。私はWindowsをつかってますので、以下はWindowsだけの情報になります。
国立国会図書館のOCRライブラリが凄くよかった件(Windows向け) - Qiita
“ruby”
へー、知らなかった
“国立国会図書館が公開しているOCRライブラリ、NDLOCR" "現在ver2.1がGithubに公開" "古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識”
これは便利そう。
へー。国会図書館がGitHubにOCRのプログラムコードをあげているの、知らなかった。旧字体や縦書きにも強い、と。今度、和古書で試してみよう。
ちなみに普通の縦書き日本語のOCRだと、何故かiOSアプリの一太郎Padがちょっと意味不明に強い https://apps.apple.com/jp/app/%E4%B8%80%E5%A4%AA%E9%83%8Epad/id1490522571
yomitokuとの比較記事待機案件
OCR?すごい技術にゃ!ボク、字が読めないから助かるにゃ!
bunkoOCRがオススメされてたな。 https://99nyorituryo.hatenablog.com/entry/2023/09/24/020328
国会図書館の話なのに「ライブラリ」が図書館の意味でなく混乱したのだが、ブコメを見る限り他の人はすんなり読めたらしい。さすがはてな。
お、これは税金を使う意味がある機能と開発成果公開
デジタルコレクションの全文検索すごいもんなあ。
すごい、これは自分でもダブルチェックしてみる
日本の近代以前の文字は全く読めないのだけど、史学科の友達に教えてあげよう。
おれも「そこそこ」のマシンが欲しいなと思いました
「日本語OCR, 有料の業務用ソフトには色々と高性能なものがあるんですが、無料の場合の選択肢は意外に限られてます」「国立国会図書館が公開しているOCRライブラリ、NDLOCR」一太郎PadやbunkoOCRもきになる
「猿飛佐助」のOCRにチャレンジしたことがあるが全くダメだった。とうとうできるようになったか。
試してみたいけどそこそこのスペックのマシンがない…。性能がいいのか分からんけど取り敢えずGUIフロントエンドがないと普及はしなさそうではある
yomitoku とは別?へー。
廃刊になった地元紙のアーカイブを画像で持っているので試してみたい
国立国会図書館が提供するOCRライブラリ「NDLOCR」をWindows環境で使用する方法についての解説。古い書籍や旧字体に対しても高い認識精度を持っているらしい。
後で試す
そっちの「ライブラリ」か。図書館のライブラリって「力こそパワー」っぽさがあるのに完全に正しい使い方だった。
その点Copilotのphi3、今の所縦書きとか手書きの日本語にめっちゃ弱いのが残念なんだよなぁ。Windows Recallで板書がうまく拾って貰えないんよ
今はどうか分からないけど一太郎PadのOCRエンジンはGoogle Cloud Visionを使っているらしい https://internet.watch.impress.co.jp/docs/news/1222537.html
ScanSnapのデフォルトOCRであんま不自由してない(pdftotextでOCR透明テキストを抜いてローカルのelasticsearchに突っ込んで全文検索してる)けど、どうなのかなこれ。
“無料OCRはGeminiは縦書きに弱い。Github公開の国立国会図書館OCRライブラリは旧字体でも高い精度で認識。NVIDIAのグラボ必要。Dockerコンテナの起動。VSCodeのDocker拡張機能を使うと、作業がかなり楽に”
開発者の青池さんもリポストされてるね https://x.com/blue0620 ご本人から補足つっこみ頂戴したけど、今の次世代デジタルライブラリーの全文テキスト作成にはNDLOCRは使っていないらしい https://x.com/blue0620/status/1671506309081104384
“NDLOCRは、現在ver2.1がGithubに公開されています。古い本が多い国会図書館の資料向けに作られているだけあって、旧字体でも高い精度で認識してくれます”
どの程度のOCR精度なのかが書いていないけど、自分が試した時には求める品質には及んでいなかった。Macでは…の件はコンテナを使えばいいだけ。
“国立国会図書館が公開しているOCRライブラリ、NDLOCR...このライブラリを試してみました。基本、Githubサイトに書いてある通りなんですが、いくつか注意すべき点をメモ”
GitHubに公開されてるのすばらしい。
Githubサイトにある通り、NVIDIA Driverが、Linuxの場合: 450.36.06以上、Windowsの場合:520.06以上である必要があります。Macでは動かないです。私はWindowsをつかってますので、以下はWindowsだけの情報になります。