最近、色々あって機械設計に関する勉強をしています。
今年は機械設計技術者3級取得を目標に勉強をしようと思います。
機械設計技術者は過去問題を無償公開していますので、勉強をするにはうってつけの環境がそろっています。
とはいえ、紙の過去問題をPDFにしているようで、資料内の文字は文字として認識出来ません。
文字を認識できないと、単語から検索する必要があるためとても大変です。
PDFを文字起こししたいところ…
Adobe Acrobat でもWord への書き出しは出来るようなのですが、有償になるようです。
https://acrobat.adobe.com/proxy/pricing/jp/ja/export-pdf.html
出来る事なら手軽に文字おこししたいものです。
さて、 今回は Google ドライブを使用した PDF の文字起こしについて紹介します。
手順
1. PDFをアップロード
Google ドライブを開き、PDF をアップロードします。
ファイルをそのままアップロードします。
2. アップロードしたファイルを「Googleドキュメント」アプリで開く
Google ドライブにアップロードしたファイルを右クリックし、
「アプリで開く」->「Google ドキュメント」を選択
3. Google ドキュメントで文字起こしされた文章が開く
アプリで開くと自動で文字起こしされます。
しばらくすると、文字の状態で表示されます。
文字起こしの具合
令和元年の過去問題を例にします。
まずは PDF の状態です
次に文字起こししたテキストです。
[1. 機構学・機械要素設計]
機械の設計で必要となる機械要素について、次の設問 (1) ~ (8)に答えよ。
(1) 転がり軸受に加える与圧の目的として間違っているものを下記の選択群〕から一つ選び、
その番号を解答用紙の解答欄【A】にマークせよ。
[選択群]
1軌道輪に対して転動体を正しい位置に保つため
2輔のラジアル方向、アキシアル方向の位置決めを正確にするとともに、軸の振れを少なく
するため 3低い駆動力で軸の高速回転を可能にするため 4軸受の剛性を高めるため
5 アキシアル方向の振動及び共振による異音を防止するため
○数字や難しい漢字、改行位置は再現できていませんが、単語を調べる分には十分です。
以上です。
PDFをここまで文字起こし出来れば、単語を抽出する事が可能です。
これで勉強がしやすくなります。