2017年11月05日

Pythonによるファイルダウンロード

こんにちは、エンジニアのオオバです。

前回記事からの続きです。

あわせて読みたい記事

PyenvでPython3.6.3インストール時のトラブル

最低限の機械学習の知識を手に入れるため勉強中。

Pythonによるスクレイピング&機械学習を読み始めると、まずPythonでファイルをダウンロードしてみよう的な基礎的な内容が始まります。

ぼくはPython初心者なので新しい事を知れて楽しいです。
本記事は上記書籍の1-1「データダウンロード」の備忘録です。

ファイルの直ダウンロード

urllib.request.urlretrieve(ファイル名, 保存ファイル名)とするとファイルを直にダウンロード出来ます。

urlopenでメモリ上にファイルをダウンロードした後、それをファイルに書き込むという処理になっています。

ここで出てくる with ~ as構文ですが、C#で言うusingのようなものだと認識しています。
処理を抜けると自動的にdispose、closeしてくれるため、コードをスッキリ書くことができそうです。

urlencode関数を使うとJSON形式のvaluesをクエリパラメータ形式に変換し、下記のように出力してくれます。便利です。

url : https://test.php?hoge=01234&fuga=piyo

sys.argv[1]でコマンドラインの引数を取得できます。

ちなみにsys.argv[0]とすると実行したファイル名を取得できます。

Pythonをほぼ初めて書いてみた感想としてはブレースがなくて、インデント管理された文法は見た目スッキリしていてとても書きやすく読みやすいです。
urllibには豊富な機能が入ってそうなので、調べてみるのも楽しそう。

ちなみにエディタはVisualStudioCodeを使っていますが、コード補完されるのでイイ感じ。

この記事が気に入ったらフォローしよう

PythonでGyazoに画像をアップロードする方法

pyenv経由でPythonをインストールする

PythonでJSON、YAML、CSV、Excelのパース方法まとめ

BeautifulSoupを使ったHTMLパース

PyenvでPython3.6.3インストール時のトラブル

簡単PythonとPhantomJSとSeleniumを使ったWebサイト画面キャプチャ

検証環境