熊本の司法書士・行政書士まつむら・まつなが事務所です 2

熊本の司法書士・行政書士まつむら・まつなが事務所です 1(https://mm-nankanoffice1.com/)も宜しくお願いします!

齊藤貴義著『スクレイピング・ハッキング・ラボ Pythonで自動化する未来型生活』購入しました

この本は、スクレイピング楽しいよ!という本だと思います。スクレイピングということをやるためにPython(パイソン)というプログラム言語を環境構築から解説されています。

わたしがずっとフィトンと読んでいたのは内緒です。

スクレイピングというのはざっくりわたしの理解でいうと、インターネットからデータをひっぱってくる技術です。それでいったいどんなことができるん?というのは、わたしも初心者なので……。ただ、今は簡単なプログラムをまるっとコピーして試している段階ですがそれでもおもしろいです。楽しいですよ!

環境構築というのは、今回でいうとPythonというプログラム言語をあなたが持っているパソコンで使えるようにする、ということです。

実は、Pythonには面倒な環境構築は不要でいきなり使えるモードもあります!しかし、環境構築をするとできることが増える!とのことで、また、やりかたも丁寧に記載してあり安心して環境構築ができました。感謝です。

以下は、プログラミング初心者の奮闘記です。やろうとしていることは割とニーズはあるんじゃないかと思っています。自分のブログ記事のタイトルをスクレイピングして引っ張ってきて、それをアイキャッチ画像にするというプログラムを作ろうとしています。

なんやようわからんけど買っとくわ!という方はこちらのリンクからどうぞ。

齊藤 貴義 (著) Pythonを使ったWebスクレイピングテクニックについての解説書。Kindle版(電子書籍)とオンデマンド (ペーパーバック)版があります。

わたしはKindle版を購入しております。スマホで閲覧しながらプログラムをノートパソコンに入力しています。

ブログのアイキャッチ画像をイチからつくるのが面倒くさい!

はてなブログでは、アイキャッチ画像を自動生成するサービスがすでに実装されています。

アイキャッチ画像がない記事をシェアした際、ブログタイトルや本文などから画像を自動生成するようにしました - はてなブログ開発ブログ

これ便利だなと。TwitterなどのSNSにブログ記事を放流する場合、アイキャッチ画像があったほうが見栄えがするとわたし個人は思っております。

WordPressでも同じことができんかな?というのがとっかかりです。

まずはググってみた

まっぽしのやつはみつけられなかったのですが、Pythonというプログラム言語で文字列を画像に変換することはできるみたいということがわかりました。

qiita.com

ここでは1つの指定された文字列を画像化していますが、たぶんこれを変数にすればいいんだろ?という目論見です。

Pythonがどんなもんかざっくりと学習する

今年の6月にProgateは、無料部分のみですが履修完了しております。これはやったほうがいいと思います。

Progateは、プログラミング言語を学習するサイトです。

今年、令和2年の6月頃にやってますね。

コロナ禍のなかでなにか1つ新しいことやってみようと思ったのだったかな?

Pythonには面倒な環境構築は不要でいきなり使えるモードがあった……のだけど……

Pythonにあるという言い方でいいのかどうかわからないのですが、Google Colaboratory(以下Google Colab)というものがあります!

これはこれですごいな~と。

karaage.hatenadiary.jp

ただ残念なことに上記の「文字列を画像に変換する」というプログラムは動かなかったのです!!!!!!

リンク「文字列を画像に変換する」の2段落目にあるAnacondaというものが、Pythonを動かすまるごとパッケージのようなものだということはわかったのですが、パソコンの中に知らないものをダウンロードすることがちょっと怖くてですね。

またAnacondaをダウンロードしてもそもそもプログラムをやらなくなる可能性も十分にあります。

ということで挫折しておりましたところ、

  • Pythonをやってみようという動機付け(スクレイピングおもしろそう)
  • Anacondaの導入も丁寧に書いてある 

わたしにとってはちょうどよいタイミングで良き本と出会ったという感じです。

Anaconda環境で「文字列を画像に変換する」を走らせてみる

一瞬できてない!?と思ったのですが、ちゃんとできてました。

パソコンの左下の検索窓に「image.png」と入力してやると、どこに画像が保存されたかがわかりました。

f:id:mm-nankanoffice:20201003191824p:plain

言っている意味はよくわからんが

もともとimage.pngという画像データがある場合、上書きするような感じです。お気を付けください。

プログラム「文字列を画像に変換する」とプログラム「スクレイピング・ハッキング・ラボのやつ」 を合体させてみる

とりあえずここまでできた!

f:id:mm-nankanoffice:20201003191715p:plain

できた!

このブログ記事のタイトルをスクレイピングして、変数に代入しています。途中で途切れているのは表示の仕方がまだわからんとです……。

www.mm-nankanoffice2.com

とりあえず楽しい

ふと考えると、スクレイピングしてブログタイトルを取得するということは、ブログタイトル一覧があるページをスクレイピングしなければならない?

それだったらGoogle Search Consoleでできるのかな?一気にブログ記事タイトルをエクスポートしてCSVのデータにして、それを変換するみたいなことをすることになる?

わからないことが多々ありまだまだ先は長いのですが、とりあえず楽しいです。

わたしもまだ繰り返しの文法もわかってないぐらいのレベルです。ぜひぜひいっしょにPythonで自動化する未来型生活へ向かってみませんか?

齊藤 貴義 (著) Pythonを使ったWebスクレイピングテクニックについての解説書。Kindle版(電子書籍)とオンデマンド (ペーパーバック)版があります。


著者さんによるサポートページはこちらです。あわせてご確認ください。

www.geek.sc

この記事には続きがあります

第2回はこちら

www.mm-nankanoffice2.com

第3回はこちら

www.mm-nankanoffice2.com

第4回はこちら

www.mm-nankanoffice2.com

まだまだ続く……予定