[他分野エンジニア向け] Pythonとは

スポンサーリンク

概要

Pythonとはプログラミング言語の一種です。
1991年にオランダ人のグイド・ヴァンロッサム氏が発表しました。
機械学習の分野で人気のある言語ですが、WebシステムやIoT (Internet of Things) システム等の様々なアプリケーション開発で使用されています。

特徴: インタプリタ言語

Pythonの特徴の1つとしてインタープリタ言語であることが挙げられます。
そもそもプログラミング言語とは下図のように、コンピュータ上で動作するソフトウェア (プログラムとも言う) を生成するための言語で、人間にとって読みやすい処理の記述から0と1でできたコード (機械語) を生成するための言語です。

プログラミング言語で書いた処理のことをソースコードと呼びますが、ソースコードから機械語を生成する方法には主に2種類あります。
1つはコンパイル方式と呼ばれるもので、ソースコードを一括変換で機械語にするというものです。
もう一つの方法はインタプリタ方式と呼ばれるもので、ソースコードを1つ1つ (1行や1部分ごと) 機械語に変換していく方法です。

Pythonはインタプリタ方式で機械語に変換されます。
データサイエンスにおけるインタプリタ方式の利点として、ソースコードを1部分ずつ実行できるため、データ分析の試行錯誤がしやすいという点が挙げられます。
例えば、ファイルを読み込む処理 → データの欠け (欠損値) を補間する処理 → グラフを描画する処理 といった流れを全部作り込む前に1つ1つ試すことができます。

実行環境の種類

Pythonの実行環境は下図のように大きく分けてターミナル系とJupyter Notebook系の2種類があります。

  • ターミナル系
    一般的なプログラミング言語の場合と同様に、何らかのテキストエディタでソースコードを書き、ソースコードをインタプリタに渡すことで実行します。

    プログラムがある程度完成してから実行することになるため、アプリケーション開発に向いているという特徴があります。
    また、テキストエディタ上で開発するため、後述のJupyter Notebookと比較して、ファイル同士の差分抽出や差分挿入が楽という特徴もあります。

    ターミナルやコマンドプロンプト向けの実行環境をインストールする方法にはいくつか種類があり、代表的なものとして次の2つが挙げられます。
    • Python.org で配布されているインストーラを使用する方法
      Python公式のインストール方法で、標準ライブラリのみがデフォルトでインストールされる
    • Anacondaを使用する方法
      Pythonの標準ライブラリに加えて、数値計算やデータ分析で使用するライブラリを一括でインストール・管理できる
  • Jupyter Notebook系
    Webブラウザ上で使用する環境で、Webページを作成するような感覚でソースコードを記述します。

    Markdown形式のテキストボックスやPython実行用の特殊なテキストボックスをWebページ上に配置することで、1枚のWeb形式のレポートのような形でソースコードをまとめていきます。

    ソースコードはPython実行用のテキストボックスごとに実行でき、実行結果はメモリ上に保持されるため、ソースコードを1部分ずつ実行することに向いています。
    特に、別途解説する予定の探索的データ分析のような、試行錯誤が必要なプログラミングをするときに向いています。

    Jupyter Notebook の実行方法は2種類あり、PC上にWebサーバアプリケーションを立ち上げて実行する方法とGoogle Drive上のファイルとして実行する方法があります。

どちらの環境が適しているかは人それぞれの状況に合わせて判断します。
なお、実行環境の構築方法については、ソフトウェアのバージョンによっても変化するため、他サイトや他書をご参照ください。


データサイエンスに関する記事はメニューバーの「データサイエンス」からどうぞ

コメント

タイトルとURLをコピーしました