EmEditorへ1312万字のブログ記事を移してサクサク確認する方法

大容量ファイルを扱うのであれば EmEditorというソフトがおすすめです。
1312万字のテキストファイルを開いてもサクサク動きます。

Screenshot_5

 

大容量ファイルの憂鬱

大昔に比べると、パソコンで「ファイルのサイズが大きくて開かない」とか「重くて動かない」ということは少なくなりました。
今年か去年発売されたパソコンを買って使っていて、普通に使うのであれば問題はないでしょう。
(古いパソコンだからといって動かないわけではありませんが。)
Excel でファイルサイズが大きすぎるというときは他に原因もあり得ます。
Excelのファイルサイズが大きくなりすぎた場合の対処方法 | EX-IT

大容量のファイルでも、テキストファイル(.txt。メモ帳で開くもの)にすれば、操作を軽くすることができますが、そのテキストファイルでも、たとえば 1312万字 のファイルを開くと固まって、応答なしになってしまいました。

Screenshot_101

通常は、こういった大容量ファイルを使うことはないかもしれませんが、もし大容量ファイルを使う場合には EmEditorを使うと便利です。
(大容量じゃなくても便利な機能は多いです)

 

  EmEditor なら大容量ファイルも使える

EmEditor とは、 Windows のテキストエディター、テキストファイルを扱うソフト。
30日の無料試用版もあり、
・初年度4,800円+それ以降は年2,400円
・買いきりの21,600円
という買い方ができます。

この EmEditorであれば先ほどの1312万字あるファイルもサクサク開けるのです。
(容量にすると、29MB)
Screenshot_104 (1)

開くだけではなく、読むのも楽ですし、瞬時に移動もできます。

Screenshot_105

本1冊の文字数は、5万字から10万字くらいです。
(図版が多いと少なめになります)

先日、書き上げて提出した本は、10万3000字でした。
(ページ数が多いのでだいぶ削ることになりますが。)

Screenshot_44

その10万字と比べると、1312万字というのは膨大な量です。
このファイルは、このブログの過去のすべての記事5000記事を1つのファイルでまとめたもの。
(1日数記事投稿していた時期もあるので、ブログをやっている日数よりも記事数が多いのです)
WordPress のプラグインでカウントすると約800万字でしたが、EmEditorに移したデータは、URLやタグもあるので、それよりも多い1312万字となっています。

このように、アウトラインで、めあての記事も探しやすいですし、もちろん検索もできます。
なんとなく眺めていても楽しいです。
(反面、こ、こんな記事を……と苦しくもなりますが
Screenshot_105
もともとはExcelやEvernote 、ブログのカテゴリーで 管理していましたが、1つのファイルに入っている EmEditor のほうがはるかに便利です。

当初は、毎日書いているメルマガ税理士進化論(今日で2330号)もEmEditorにまとめています。
メルマガは 208万字です。

Screenshot_45
メルマガは、以前Wordファイルで保存していましたが、すべてを1つのファイルにすると動きが重すぎるので1000記事くらいに分けて管理していたのです。
Wordファイルではなくテキストファイルで管理したほうが軽く、サクサク動くのですが、Wordだとアウトラインが使えるので重宝していました。
EmEditor だとテキストファイルの軽さに加えて、このアウトラインをはじめとする便利な機能が使え、最強なのです。

ブログのすべての記事を  EmEditorに移す方法

ブログ記事をこのEmEditorに移行する方法をまとめてみました。

前提としてブログ記事の画像はそもそも別ファイルなのでEmEditorに入れることができません。
テキストのみです。
この方法で貼り付けた後、ある程度置換してデータを整える必要がありますが、別に整えなくても1つのファイルにまとまるだけで十分でしょう。

ブログ記事をEmEditorに移すのに、記事を開いてコピーして貼り付けしていたら大変ですし、到底できません。
もっとエレガントな方法があります。

 

データベースのダウンロード

そもそもブログ記事はこういったデータベースになっているのです。
image
Excelのような形式で、この列には記事のタイトルが入り、この列には記事が入り、この列には投稿日が入るといったしくみになっています。
ブラウザを開くと、このデータベースから指定したデータを組み合わせて開くというしくみです。

このデータベースは、レンタルしているサーバーにあり、それをダウンロードすればファイルとして使えます。

手軽にダウンロードするなら、プラグインWP All Exportがあります。
ただエラーも起きる可能性がありますし、私のように記事数が多いと使えません。

Screenshot_47

WordPress のしくみを知る意味でもおすすめかつ確実な方法もやってみましょう。
自分のサイトのデータベースに直接アクセスします。

使っているサーバーによってアクセスする方法が違いますので調べてみましょう。
wpX だと、サーバーの管理画面からブログのドメインの[設定]→[データベース管理]の phpMyAdminの[ログイン]をクリックすればデータベースにアクセスできます。

image

さくらインターネットなら、サーバコントロールパネルにあります。

もしデータベースのパスワードを知りたいのであれば、 FTP ソフトでサーバーにアクセスして wp-config.php というファイルの中に,データベースの ID とパスワードが書いてあるので確認してみましょう。
(さくらインターネットだと、サーバコントロールパネルのファイルマネージャーからwp-config.phpを確認できます)
image

ここからの画面はどのサーバーも同じです。

ログインした後、投稿(記事)が収められているデータベースwp_postsを探します。
(設定によっては〇〇_postsと〇〇の部分が異なります)

image
これを選択して表示してみると、確かに記事が収められているのがわかるので確認しておきましょう。

たとえば昨日の記事だと、このようになっています。

image
ここで削除してしまうと記事が消えてしまいますので、要注意です。

次にエクスポートをクリックして、このデータベースをダウンロードします。
[フォーマット]は、CSVを選びましょう。

image

 

Excelでデータベースを加工

そのダウンロードした CSV ファイルをExcelで開くわけです。
単に開くと文字化けするので、Excel の[データ]タブ→[テキストまたは CSVから] をクリックしましょう。

image

ここで、文字コード をUnicode(UTF-8)にして、[データの変換]をクリックします。Screenshot_7
次の画面で[変換]タブの[列の分割]→[区切り記号による分割]を選び、Screenshot_8

[コンマ]を選び、OKをクリックし、Excelへ戻ると、CSVファイルが開いているはずです。
Screenshot_9

データベースには、不要な行もあるので必要な行だけ表示しましょう。

投稿(記事)のみ表示するなら、フィルターで8列目では、[publish](公開)を選び、
image

22列目では[post](投稿)を選びます。
image

表示された記事をコピーしてEmEditorへ貼り付ければ、1つのファイルになるわけです。
ただ、投稿日や記事タイトルも EmEditor にあったほうが便利ですので、 記事タイトル、記事、投稿日が入ったデータをExcelの数式でつくります。
なおかつ記事タイトルは何か印を付けておくと、 EmEditor でアウトライン表示することができるので何かしるしをつけましょう。
☆や★でもいいのですが、記事中に使っているとそれもアウトライン表示してしまいます。
私は、☆〇□にしました。

image
記事タイトルと日付はくっつけるとして、その次に続く[記事]の前で改行していたほうがEmEditorで処理しやすいので、改行する位置にしるしを入れます。
私は、〇△〇にしました。
EmEditorで〇△〇を改行に置換します。
適宜スペースを入れ、次のような数式を入れ、データの数だけコピーし、
image
そのコピーしたデータをさらにコピーしてEmEditorに貼り付けましょう。

image

EmEditorでの設定

EmEditorで置換、設定していきます。
まず、タイトルの日付のあとに、〇△〇と改行すべきところがあるので、

Ctrl+H(置換)で、検索する文字列を〇△〇、置換後の文字列を¥n(改行の意味)にして、[正規表現]にチェックが入っていることを確認して、[すべて置換]にしましょう。

また、テキストには、h2というタグもありますので、私は、■■にし、前後を改行しています。Screenshot_39

アウトライン(右側の目次)は、EmEditorの[ツール]→[現在の設定のプロパティ]を選び、

image

[アウトライン]で、[カスタム]を選択し、☆〇□(アウトライン、記事タイトルのしるし)を入れて、[追加]を選びます。

image

EmEditorの[表示]→[アウトラインバー]で、右側にアウトラインが表示されます。

image
もし強調したい場合は、[現在の設定のプロパティ]で強調(1)を選び、☆〇□.+と入れ、正規表現にチェックを入れれば、タイトル全体の色を変えることができます。
☆〇□.+は、が☆〇□に続く任意の文字という意味の指定です。

image

その他、私は余計なものを置換して消してします。

たとえば 次のようなものを消すなら、置換後の文字列を空欄にして置換すれば消せるのです。

image

 

過去のブログ記事を一覧で見直したりするとネタを呼び起こすこともありますし、単純に楽しめます。
一方で、自分の黒歴史も見ることができるのですが……。
黒歴史といっても公開されているわけなんですけど。

こういうことをしておくと、ブログ記事やメルマガは資産として蓄積されていることを実感できます。
記事数が少なければテキストファイルやWordにもできますので、Word で重いようでしたら EmEditorを使うというのでもよいでしょう。

EmEditorは、アウトラインがかんたんに設定できるというのは大きなメリットです。
フィルタリングも高速です。
image

ブログやメルマガを再編集して本にするということもできます。
まあ、やろうとしているんですが。
このままでもニーズはあるのかなと思ったりはしますけど。

EmEditor、ぜひ使ってみていただければ。
無料で30日試用できます。

 



■編集後記

VAIOの調子が悪いので、メインPCをSurfaceBook 2に。
サポートに聞きつつ、いろいろやってみますが、盆休み明けに修理に出すかもです。
(なぜか壊れるのはこういう時期……)
VAIO、気に入ってはいるのですが、トラブル多し。
次期メインPCは、発売予定のSurfaceBook 3か、MacBookProの16インチを考えています。

MacはTouchBarとかキーボード、ベゼルしだいですね。

 

「1日1新」

SurfaceBook 2の設定変更

 

■娘(2歳)日記
「片づけようね」ではなく、「元に戻そうね」と言ったほうがいいと本で読み、実際にそう言ってみると、すんなり元に戻していました。
自分にも言い聞かせたい言葉です。