Duo3.0のテキスト加工

Duo3.0って英語学習シリーズがあります。

<pこんなやつ。結構評判は良いようで専用のアプリなんかもあります。

play.google.com

で、アンドロイド端末にテキストや音声データを放り込んでおくと、画面に表示しながら読み上げてくれると言うもの。

本来なら手打ちでテキストを用意しなければいけないのでしょうが、著作権的な問題はおいておいて、本文を抜粋してくれているサイトが有りました。

 

quizlet.com

まずは復習用まとめ~のサイトからテキストをコピーしてLiberaOfficeに貼り付けます。

Ctrl+Shift+Vで貼り付けオプションを表示させて、書式設定されてないテキストを選択。

f:id:b2fireb4beat:20170725160317p:plain

 するとこんな画面が出るので、区切りオプションを固定長にして貼り付けます。固定長じゃないと、文の中のコンマやダブルクォーテーションを区切り文字と認識して変な文章の区切り方をします。

f:id:b2fireb4beat:20170725160411p:plain

 張り付きました。

f:id:b2fireb4beat:20170725160451p:plain

全体を一行下げ、かつ右に一列ずらし、一番最初のセルに1をうちます。

f:id:b2fireb4beat:20170725160622p:plain

 上から三行目までを選択して、右下の四角い黒い点をしたにずっとドラックすると。

f:id:b2fireb4beat:20170725160833p:plain

 等間隔で数字が打たれます。この時点では数字はなんでもいいのです(ぶっちゃけこの数字は一回消すので特定の文字列が本文に対して定位置にあればなんでもいいです)

f:id:b2fireb4beat:20170725161002p:plain

 最後の例文の数字が560になってればいいです。

f:id:b2fireb4beat:20170725161130p:plain

ここまで来たら今度は全文をコピーしてテキストエディタに貼り付け。

テキストエディタは、

・タブが表示させる
正規表現での置換ができる

の条件が満たされていればなんでもいいです。ここではサクラエディタを利用。

f:id:b2fireb4beat:20170725161457p:plain

 ここで「^」と表示されているのが、タブです。エクセルで言うところの内容が入力されていないセルです。まずはこれを削除。

置換を選んで置換対象に「\t」と半角で入力、置換後は何も入力しない。おまじないみたいなもんです。そして置換。

f:id:b2fireb4beat:20170725161702p:plain

 

 置換が完了すると「^」がなくなり、隙間がなくなりました。

f:id:b2fireb4beat:20170725161817p:plain

さらにもう一回おまじない。置換対象に「[\d]+?\r」と入力し、置換後に「\r\r」と入力。

f:id:b2fireb4beat:20170725161944p:plain

 すると現題の文と、日本語訳が一つの改行で、次の文との間に二つの改行が入るテキストになりました。

f:id:b2fireb4beat:20170725162135p:plain

後は最初と似たような手順をもう一回繰り返します。

 Calcに貼り付けて

f:id:b2fireb4beat:20170725162344p:plain

一列空けて

 

f:id:b2fireb4beat:20170725162454p:plain

数字打って四角の黒い点を下までドラッグ。

f:id:b2fireb4beat:20170725162546p:plain

 

f:id:b2fireb4beat:20170725162727p:plain

最後の文の番号が560になってればOKです。これをもう一回テキストエディタに持っていって、もう一回「\t」を置換すれば。

f:id:b2fireb4beat:20170725162914p:plain

アプリ用のフォーマットが整いました。

f:id:b2fireb4beat:20170725163017p:plain

最後に一番上の行を改行し、一行目には何も書かれていない常態にすれば完成です。

面倒くさいが楽

はてブ界隈はIT戦闘力が高い(と勝手に思い込んでいる)のでこんな泥臭い方法をブログにすると殴られてもおかしくはないと思いますが、世の中の皆が皆、鼻ほじりながらマクロくんだり、正規表現をそらで扱える訳ではないです。

ただで使える方法で多少のソフトの行ったり来たりで整形できるならそれに越したことはないと言うことで記事にしてみました。

「IT戦闘力たったの5か、ゴミめ」

と言う方には是非ワンパンで定型フォーマットを吐き出せるバッチファイルでも作ってください。僕が使います。

以上。