プログラミング

スポンサーリンク
IT関連

【Python】Stringデータを変数名(シンボル名)に変換する方法

Pythonの変数の実体、気になりませんか? 仕事や、kaggleでPythonを使っていると、csvファイルの処理でPandasを使うことが多いと思います。 Pandasを用いるということは、基本的にDataFram...
IT関連

【メモ】特徴量エンジニアリングについて:その1

この記事は、主に自分がkaggleをやるにあたって勉強した内容をまとめます。 今回は特徴量エンジニアリングについてです。
IT関連

【IT/コンピュータ】プロセスとは何ぞや?

ITの勉強をしていると出てくる用語に「プロセス」や「スレッド」があります。コンピュータが認識する「プロセス」の実体とは何か?となると案外言葉にできないものではないでしょうか。この記事では、自分が「プロセス」というもののイメージを掴むにあたって調べたことなどを中心にまとめていきたいと思います。
プログラミング

行列の積を「ベクトルを要素に持つベクトル同士の内積」とみなす

最近流行りの機械学習に入門するとなると、理論面で避けて通れないのが線形代数です。主に多次元を扱う関係上出てくるのですが、多変数ガウス分布の最尤推定とか、最適化計算とかでも行列を大量に扱う場面というのがしばしば出てきます。
IT関連

【Python/TensorFlow】tf.estimator.Estimatorを用いた学習のやり方(モデル作成 by Keras)

この記事では自作のモデル(と言ってもかなり単純なものにしますが)でこのEstimatorを使用するとどうなるかについてまとめていきます。
IT関連

【Python/Tensorflow】SequenceExampleを使用したSparseTensorのシリアライズ方法

Tensorflowの公式ドキュメントにて、「SparseFeature」よりも「SequenceExample」と「VarLenFeature」を用いた方が良いという記述があります。本当かどうか確かめていなかったので、そこについて調査し、その結果をまとめます。
IT関連

【Python/Tensorflow】SparseTensorを学習に用いる際の注意点

SparseTensorを使おうとするとあちこちに罠が仕掛けられていて、TFRecords形式に保存するのも学習を回すのもなかなかうまくいきません。しかも、日本語の情報が皆無なうえに、英語の情報もリッチとは言えません。更に公式ドキュメントもなかなか分かりづらいです。 という訳で、SparseTensorについて調べてるとそれなりの情報量になりました。結構困ったので、同じ轍を踏む方が一人でも少なくなるように、とこの記事を書こうと思った次第です。
IT関連

【Python/Tensorflow】TFRecordsから学習を行う方法

本記事では複数データのTFRecordsへの書き出し・書き出したファイルからの読み出し、実際に学習を行う際にはどうするのかというのを簡単な多層パーセプトロン(MLP)に適用して確認してみたいと思います。サンプルコードを載せているので、コピペすれば動作確認することが可能です。
IT関連

【Python/Tensorflow】 TFRecordsとは何ぞや?

TensorFlow(Keras)で大規模データを扱っていると、学習開始前のデータの読み出し(転送)でめっちゃ時間がかかることがあります。普通はGeneratorを利用して解決するのですが、AWSの環境などではそうもいかない場合があります。本記事は、学習におけるI/Oボトルネックを解消する際に用いられるTFRecordについて、自分なりに調べた内容をまとめます。
プログラミング

【Python】データのシリアライズ概要と関係モジュール

本記事はPythonのシリアライズと、関係モジュールについての個人的な備忘録的なものです。想定読者は「機械学習やってたら○○.pickleとかいうファイル出てきたけどこいつ何者?ってなった人」「直列化とかシリアライズとか言われてもイマイチピンとこない人」になります。
スポンサーリンク
タイトルとURLをコピーしました