人工知能についてのメモ②「Python環境の設定」
人工知能についてのメモ①では人工知能についてを軽く知り、それを実現するためには機械学習または深層学習が方法としてあり、いろいろな言語があるけどPythonが一番人気というところまでやりました。
今回はPythonの環境を整えて少し触るところまでです。
Anacondaのインストール
Pythonを調べていると便利便利と書いてあるのでAnacondaというものを使用していきたいと思います。
Anacondaは「Python本体と、Pythonでよく利用されるライブラリ」がまとまっているパッケージらしいです。(開発ツールみたいなものと理解しておきました)
www.anaconda.com
Anacondaのダウンロードページから私はPython 3.6 version (64bit) のインストーラーをダウンロードしました。
途中に選択やチェックボックス等ありましたが一応そのまま「Next > Next > Install」といった感じでインストーラーに従いました。
※注意:インストール途中にcmd.exeが開きますが閉じてしまうとインストールできないものが出てきたりするので放置しましょう。
対話型実行環境 Jupyter Notebook
Pythonのコードを含んだWebページを作成できる機能(つまりGitをcmd.exeでやるかSourcetreeのようなGUIツール使うかみたいなものと認識しました)
これを使って可視化しながら簡単なものからやっていきたいと思います。
インストールしたツールはAnaconda-Navigatorから開けるようです。
またJupyter Notebookの直接リンクがありますがブラウザの方が開かなかったことがあるのでAnaconda-Navigatorから手順を踏んで開いた方がよさそうです。
Jupyter Notebookを開くとJupyter NotebookのWindowとブラウザが立ち上がります。
「Documents\Python Jupyter Note」のフォルダを作りそこで作業することにしました。
- Documentsをクリックして階層を移動。
- 右上のNewをクリックし「Folder」を選びリストにUntitled Folderを追加。
- Untitled Folderをチェックし、左上に出てくるRenameを押す。
- フォルダの名前が変更できますので適宜変更してください。
エクスプローラーでフォルダを作り、再度ブラウザを開くことでもOKです。
Pythonの基礎
作業フォルダの作成
Python Jupyter Noteのブラウザで先ほど作った「Documents\Python Jupyter Note」を開きます。
右上の「New」から「Folder」を選択し、Untitled Folderを作成します。
Untitled Folderを選択して、「Rename」でHello Pythonという名前に変更します。
今回は「Documents\Python Jupyter Note\Hello Python」を作業フォルダとして利用します。
Python3の作成
右上の「New」から「Python3」を選択します。
作業フォルダにUntitled.ipynbが作成され、別のブラウザでチャットのような画面が開きます。
Hello Python
作成したUntitled.ipynbの「In [ ]:」の横の入力欄に以下のコードを打って「Shift」+「Enter」を押してください。
print('Hello Python!!')
これで入力に足して「Hello Python!!」と出力されました。
コードを入力し「Shift」+「Enter」で実行して出力という作業が、Jupyter NotebookでのPythonプログラミングの基本となります。
ちなみに一度入力した場所のコードを修正して実行することで出力結果も更新されます。
変数を用いた計算
変数を用いて計算なども可能です。
a = 12 b = 35 c = 53 a + b + c
aに12、bに35、cに53を代入してその3つを足した数、100を出力します。
ファイルの読み込み
機械学習にはデータの入力が必要です。
いちいちデータを手で入力していてはキリがないのでファイルを読み込む機能を使用します。
まずは読み込むためのファイルを作成します。
作業フォルダにて右上の「New」から「Text File」を選択します。
その後作成されたUntitled.txtをチェックして左上の「Rename」でData.csvに名前を変更します。
Data.csvを開いてcsvのコンマ区切り形式で適当にデータを作ります。
作成したファイルをUntitled.ipynbと同じフォルダに配置します。
以下のコードを実行することでファイルを読み込んで出力することができます。
import pandas as pd data = pd.read_csv('Data.csv') data
一番左の太字の0,1,2は何個目のデータかを表しており、その右側はファイルに入力したものと一致しています。
全て空白の行があった場合はスルーされます。
また、ファイルの拡張子がtxtの場合でもコンマ区切りになっていれば問題ないようです。
※しかし一般的には拡張子はcsvなので合わせた方が良いでしょう。
「import pandas as pd」はpdにpandasというデータ分析に特化したライブラリをインポートしており、そこからデータを読み込むことでエクセルやCSVデータを簡単に扱うことが可能になっています。
ファイルの保存
画面上の「Untitled」という部分を任意の名前(HelloPython)に変更し、左上の「File」の下にある保存ボタン(フロッピーディスクのアイコン)を押して完了です。