Duo3.0のテキスト加工
Duo3.0って英語学習シリーズがあります。
<pこんなやつ。結構評判は良いようで専用のアプリなんかもあります。
で、アンドロイド端末にテキストや音声データを放り込んでおくと、画面に表示しながら読み上げてくれると言うもの。
本来なら手打ちでテキストを用意しなければいけないのでしょうが、著作権的な問題はおいておいて、本文を抜粋してくれているサイトが有りました。
まずは復習用まとめ~のサイトからテキストをコピーしてLiberaOfficeに貼り付けます。
Ctrl+Shift+Vで貼り付けオプションを表示させて、書式設定されてないテキストを選択。
するとこんな画面が出るので、区切りオプションを固定長にして貼り付けます。固定長じゃないと、文の中のコンマやダブルクォーテーションを区切り文字と認識して変な文章の区切り方をします。
張り付きました。
全体を一行下げ、かつ右に一列ずらし、一番最初のセルに1をうちます。
上から三行目までを選択して、右下の四角い黒い点をしたにずっとドラックすると。
等間隔で数字が打たれます。この時点では数字はなんでもいいのです(ぶっちゃけこの数字は一回消すので特定の文字列が本文に対して定位置にあればなんでもいいです)
最後の例文の数字が560になってればいいです。
ここまで来たら今度は全文をコピーしてテキストエディタに貼り付け。
テキストエディタは、
・タブが表示させる
・正規表現での置換ができる
の条件が満たされていればなんでもいいです。ここではサクラエディタを利用。
ここで「^」と表示されているのが、タブです。エクセルで言うところの内容が入力されていないセルです。まずはこれを削除。
置換を選んで置換対象に「\t」と半角で入力、置換後は何も入力しない。おまじないみたいなもんです。そして置換。
置換が完了すると「^」がなくなり、隙間がなくなりました。
さらにもう一回おまじない。置換対象に「[\d]+?\r」と入力し、置換後に「\r\r」と入力。
すると現題の文と、日本語訳が一つの改行で、次の文との間に二つの改行が入るテキストになりました。
後は最初と似たような手順をもう一回繰り返します。
Calcに貼り付けて
一列空けて
数字打って四角の黒い点を下までドラッグ。
最後の文の番号が560になってればOKです。これをもう一回テキストエディタに持っていって、もう一回「\t」を置換すれば。
アプリ用のフォーマットが整いました。
最後に一番上の行を改行し、一行目には何も書かれていない常態にすれば完成です。
面倒くさいが楽
はてブ界隈はIT戦闘力が高い(と勝手に思い込んでいる)のでこんな泥臭い方法をブログにすると殴られてもおかしくはないと思いますが、世の中の皆が皆、鼻ほじりながらマクロくんだり、正規表現をそらで扱える訳ではないです。
ただで使える方法で多少のソフトの行ったり来たりで整形できるならそれに越したことはないと言うことで記事にしてみました。
「IT戦闘力たったの5か、ゴミめ」
と言う方には是非ワンパンで定型フォーマットを吐き出せるバッチファイルでも作ってください。僕が使います。
以上。