仕事効率化

Python

Python基礎:Webスクレイピング②

はじめに 今回も、前回に引き続きスクレイピングを扱います。前回同様に「requests」と「BeautifulSoup」というライブラリを使います。今回は、取得したHTMLを解析する際の条件指定をselect( )を使ってやってみましょ...
Python

Python基礎:Webスクレイピング①

はじめに 今回はスクレイピングを扱います。「requests」というwebページを取得するためのhttpライブラリと、「BeautifulSoup」というHTMLから情報を抽出するライブラリを使います。requestsでURLからHTM...
Python

Python基礎:住所データから都道府県を抽出する

Python初心者でもわかるように、住所データから都道府県を抽出する方法を基本から解説します。取得したデータはいつもきれいなデータとは限りません。住所データも都道府県が分離されているとは限りません。都道府県のみを取得する方法を順を追って説明します。
Python

Python初心者向け:ディレクトリ配下のファイルをすべて読み込む

Python初心者でもわかるように、仕事の効率化に活かせる使い方をまとめています。ディレクトリ配下にあるファイルのファイル名やパスを一覧で取得したり、これらのファイルすべてを読み込みたいということもあると思います。これらを手作業でやるのは大変ですね。Pythonで自動化しましょう。
Python

Python初心者向け:正規表現を実際の利用例で解説します。

Python初心者でもわかるように、正規表現の実際の利用例をあげて基本から解説していきます。データ分析をするときに実際に出会う処理を例として扱うので、正規表現が実際にどのように使われるかがわかります。例を交えることで他のパターンにも応用することができるようになります。
Python

Python初心者向け:正規表現を基礎から解説します。

Python初心者でもわかるように正規表現の基礎を基本から解説します。まずは、基本的なパターンである特殊シーケンスを整理して、その後reモジュールの説明をおこないます。 正規表現は難しいですが、データ分析の中のちょっとした加工ならそんなに敷居は高くありません。
その他

【番外編】パソコン内のサイズの大きい不要なファイルを削除する

はじめに データ分析をしていると、PCにデータサイズの大きなファイルが溜まっていって、HDD容量を圧迫してしまうことってありませんか?ファイルをいくつか削除してもなかなか空き容量が増えない、という経験はないでしょうか? 小さいサイ...