ども♪マコトです。
今回はたまに勉強している機械学習の本について書きたいと思います。
著者
マルコス・ロベス・デ・プラド著
長尾慎太郎/鹿子木亭紀監訳
大和アセットマネジメント訳 (金融財政事情研究会)
本文
機械学習やAIは急速な進歩を遂げている。
近年、シンギュラリティーは本当に来るのか議論されているが、既にAIが人間を超える領域もある。
データ解析では、大量なデータを客観的、迅速に分析できるAIに優位性がある。
本書の「まえがき」にもあるが、投資運用はデータ分析の世界なので、AIを導入すれば人間の能力を超えたAIファンドマネジャーが市場を支配するようになると考える人も少なくない。
しかし、こうしたプロジェクトが成功に向かうケースは限られる。
群衆の英知に勝つことは認識や自動運転よりも困難と著者は指摘する。
機械学習にとってファイナンスは別物で、「ファイナンス機械学習」は独立した新分野となる。
著者は、ファイナンス機械学習が普及すればサイエンスが勘を駆逐し、投資はギャンブルではなくなると言う。
運用者の、人から機械へのシフトが進めば、市場の反応の同一性が高まり価格が大きく一方向に動きやすいなど、ネガテ ィブな影響が懸念される。
しかし、ファイナンス機械学習の広がりは市場の合理性を高め、資本市場は発展するだろう。
著者がファイナンス機械学習の啓蒙のために本書を執筆した動機がここにある。
そして訳者は、大和アセットマネジメントのクオンツメンバーである。
監訳者の長尾氏と鹿子木氏は、同分野で経験豊富なエキスパートである。
内容は専門的だが、資産運用に関係する読者にとってはなじみ深い表現が使われており、優れた翻訳書と言える。
本書は五つのpartで構成される。
Part1はデータ前処理、Part2はモデリング、Part3はバックテスト、Part4は特徴量の抽出手法、Part5はハイパフォーマンスコンピューティングである。
章立て構成は、はじめに、となる第1章を含む22章と盛り沢山である。
part別に詳細を見ていく。
Part1のデータ分析は、第2章金融データの構造から始まる。
同意では非構造化データの正規化の流れが示される。
第3章は、2次機械学習モデ ルを作るための1次モデル予測に基づくラベリング解説である。
そして逐次ブートストラップの解説の第4章に進む。
第5章は、統計学でも注目の長期記憶がテーマである。
資産価格時系列データの定常化では1回階差が広く行われる。
しかし水準情報を失う問題があるため、実数階差で長期記憶を残すものである。
モデリングのPart2は、オーバーフィット対処可能なバギングが望ましいとする第6章から始まる。
第7章では、オーバーフィットを防ぐため、k-分割交差検証の利用が示唆される。
第8章では、インサンブル重要度を測る平均不純度少量とアウトサンプルでの平均正解率減少量、補完する単一特徴量準用度が示される。
第9章交差検証法によるハイパーパラメータの調整では、k−分割交差検証法の調整法が説明される。
バックテストを示すPart3は、確率を使用してベットサイズの決定方法を示す第10章から始まる。
第11章ではバックテストをリサーチツールとして考えることが間違いであると指摘し、交差検証手法が紹介される。
機械学習にとってファイナンス分野への応用が難しい主な原因にはバックテストのオーバーフィット問題がある。
Part3では、その解決に向けた人工データセットの生成も取り上げられている。
またリターンの非正規性などの影響を統制した確率的シャープレシオ、収縮シャープレシオの紹介、戦略リスクの計算の具体的方法など様々な論点が紹介されている。
第16章では、階層的リスクバリティが優れていると示される。
金融市場分析のための特徴量のPart4は、第17章で構造変化が起こったかの可能性を探る手法の紹介から始まる。
第18章では、エントロビー の推計方法の紹介とモデリングに向けた応用例が示される。
第19年は、マイクロストラクチャー の先行研究が3世代で説明されている。そして信号処理に基づいた情報の適切な定義が提案される。
Part5のハイパフォーマンスコンピューティン グでは、第20章のマルチプロセッシングや第21章の量子コンピュータ利用に向けた最適化問題の表現、そしてローレンスパークレー国立研究所の計算知能と予測技法プロジェクト紹介が最終章である。
本書はファイナンス機械学習というタイトルだが、一般に言われる機械学習の分野にとどまらず、 データ解析や定量的モデル開発で有用な手法の具体的利用実務について幅広く取り上げられている。
内容も高度なため、本書を完全に理解するには定量分析に関する専門知識や経験が必要だろう、ただ各章末に丁寧に引用文献、参考文献が示されているため、これらに当たりながら知識を整理して積み重ねていくことで理解を深められる。
著者の記述では、各章はその前の章まで読んでいることを前提としている。
しかし実務で実際に必要な部分を中心に読みながら、理解を深めるためにそれに関連するに当たっていく読み方も可能だろう。
本書は、機械学習を用いた運用モデルの開発に携わる方にとって特に有益だろう。
手法の解説とともにPythonのサンプルコードも示されており、開発者にとって大いに参考になる。
著者が指摘するように、金融以外で機械学習を致してきた方が金融データで適用する際の解決の糸口になる書でもある。
更に様々な方に広く参考となるだろう。
一般の運用者にとっては難解と感じるかもしれない。
しかし機械学習が実務でどのように応用されるか、今後どう発展するかを知るための示唆に富む本になっている。
初心者におすすめ!
コメント