IT関連 MNISTローダとMLPの学習コードをC++/Eigenで作成する(MNISTローダ作成編) こんにちは、novです。 今回は前回の記事の続きです。 前回はローダ作成に必要なライブラリの使い方をまとめたのでした。今回は MNISTのフォーマット要件と照らし合わせたローダの設計実際のコード ... 2021.03.17 IT関連プログラミング機械学習
IT関連 MNISTローダとMLPの学習コードをC++/Eigenで作成する(要素技術メモ編) こんにちは、novです。 最近、「ゼロから作るDeep Learning」の内容をC++で書き直すということをやっています。 目的としては C++の扱いに慣れるC++のEigenライブラリの使い... 2021.02.23 IT関連プログラミング機械学習線形代数
IT関連 【メモ】AWS SageMakerでhorovodによる分散学習が動かない場合の対応とhorovodの仕組みについて 今回の記事では、AWSの機械学習マネージドサービスの一つであるsagemakerを用いて、分散学習を行う際にハマった部分をメモしていこうと思います。 2020.12.21 IT関連プログラミング機械学習
IT関連 【メモ】特徴量エンジニアリングについて:その1 この記事は、主に自分がkaggleをやるにあたって勉強した内容をまとめます。 今回は特徴量エンジニアリングについてです。 2020.12.06 IT関連プログラミング機械学習
IT関連 【Python/TensorFlow】tf.estimator.Estimatorを用いた学習のやり方(モデル作成 by Keras) この記事では自作のモデル(と言ってもかなり単純なものにしますが)でこのEstimatorを使用するとどうなるかについてまとめていきます。 2020.11.11 IT関連プログラミング機械学習
IT関連 【Python/Tensorflow】SequenceExampleを使用したSparseTensorのシリアライズ方法 Tensorflowの公式ドキュメントにて、「SparseFeature」よりも「SequenceExample」と「VarLenFeature」を用いた方が良いという記述があります。本当かどうか確かめていなかったので、そこについて調査し、その結果をまとめます。 2020.11.09 IT関連プログラミング機械学習
IT関連 【Python/Tensorflow】SparseTensorを学習に用いる際の注意点 SparseTensorを使おうとするとあちこちに罠が仕掛けられていて、TFRecords形式に保存するのも学習を回すのもなかなかうまくいきません。しかも、日本語の情報が皆無なうえに、英語の情報もリッチとは言えません。更に公式ドキュメントもなかなか分かりづらいです。 という訳で、SparseTensorについて調べてるとそれなりの情報量になりました。結構困ったので、同じ轍を踏む方が一人でも少なくなるように、とこの記事を書こうと思った次第です。 2020.11.07 IT関連プログラミング機械学習
IT関連 【Python/Tensorflow】TFRecordsから学習を行う方法 本記事では複数データのTFRecordsへの書き出し・書き出したファイルからの読み出し、実際に学習を行う際にはどうするのかというのを簡単な多層パーセプトロン(MLP)に適用して確認してみたいと思います。サンプルコードを載せているので、コピペすれば動作確認することが可能です。 2020.11.06 IT関連プログラミング機械学習
IT関連 【Python/Tensorflow】 TFRecordsとは何ぞや? TensorFlow(Keras)で大規模データを扱っていると、学習開始前のデータの読み出し(転送)でめっちゃ時間がかかることがあります。普通はGeneratorを利用して解決するのですが、AWSの環境などではそうもいかない場合があります。本記事は、学習におけるI/Oボトルネックを解消する際に用いられるTFRecordについて、自分なりに調べた内容をまとめます。 2020.11.06 IT関連プログラミング機械学習
プログラミング 【Python】データのシリアライズ概要と関係モジュール 本記事はPythonのシリアライズと、関係モジュールについての個人的な備忘録的なものです。想定読者は「機械学習やってたら○○.pickleとかいうファイル出てきたけどこいつ何者?ってなった人」「直列化とかシリアライズとか言われてもイマイチピンとこない人」になります。 2020.11.04 プログラミング機械学習