データ解析

データサイエンス

NumPyレシピ | 複数のベクトルのノルム(大きさ)はnp.linalg.normで高速計算できる!

今回はPythonデータ解析、複数のベクトルのノルムを高速に計算する方法です。ノルムの計算については複数のベクトルでもnp.linalg.norm()というメソッドを用いて計算することができます。速度的にもnp.linalg.norm()で十分です。
データサイエンス

NumPyレシピ | 複数のベクトル同士の内積は成分計算するのが速い!

今回はPythonデータ解析、複数のベクトル同士の内積を高速に計算する方法です。一つのベクトル同士の内積はNumPyのnp.dot()でできますが、np.dot()では複数のベクトル同士の内積を一度に計算することはできないため、高速に計算するには工夫が必要です。
アラサーOLのためのpython入門講座

Macレシピ | M2 Macの日本語入力セットアップ(入力ソース切替のショートカット設定)

MacBook Pro (M2チップ)で日本語入力をセットアップする方法を紹介します!入力ソースのショートカット設定でつまずき、入力ソースの切り替えができなくなる問題が発生しましたので解決方法と合わせて紹介します!
データサイエンス

統計学&pythonレシピ | 任意の確率分布からのサンプリング4(NumPy棄却サンプリング編)

本シリーズでは、任意の確率分布からランダムサンプルを得る方法をご紹介します!シリーズ第4回の今回は、棄却サンプリングをNumPyで高速実装する方法をご紹介します!第2回で紹介した方法の1/100程度の計算時間に短縮できる実践で役に立つ実装方法です!お試しください!
データサイエンス

統計学&pythonレシピ | 任意の確率分布からのサンプリング3(MHサンプリング導入編)

本シリーズでは、任意の確率分布からランダムサンプルを得る方法をご紹介します!シリーズ第3回の今回は、Metropolis-Hastingsサンプリング(MHサンプリング)という手法で任意の確率分布からサンプリングを行う方法をご紹介します!MHサンプリングは目標分布や提案分布に課される条件が緩く、便利なサンプリング手法です!
データサイエンス

統計学&pythonレシピ | 任意の確率分布からのサンプリング2(棄却サンプリング導入編)

本シリーズでは、任意の確率分布からランダムサンプルを得る方法をご紹介します!シリーズ第2回の今回は、棄却サンプリングという手法で任意の確率分布からサンプリングを行う方法をご紹介します!棄却サンプリングは実装が簡単で、仕組みも直感的に理解できるため実用性が高い方法です!
データサイエンス

統計学&pythonレシピ | 任意の確率分布からのサンプリング1(問題設定編)

本シリーズでは、任意の確率分布から任意の個数のランダムサンプルを得る方法をご紹介します!シリーズ初回の今回は、任意の確率分布からサンプリングを行う必要がある場面の例をご紹介します!実世界のデータは、一様分布や正規分布などの一般的な確率分布に従わない場合があります。そのような場合には、任意の確率分布からサンプリングする手法を用いる必要があります。
データサイエンス

データ解析のレシピ|政府統計や公的統計を扱うときは文字コードに注意すべし(pythonの場合編)

日本の公的統計のcsvデータをプログラミングで扱う際には、文字コードに注意する必要があります。なぜなら、世界標準のutf-8ではなく、ガラパゴスなcp932であることが多いからです。そんなデータでもスムーズに読み込みができる方法を紹介します!
転職

転職レシピ|博士・ポスドクのキャリア事情4(研究者のキャリアパスと生涯年収分布)

研究者のキャリアを考える上で気になる生涯年収!統計データを使って研究者の生涯年収の分布を推定します!
データサイエンス

統計学レシピ|正規分布を超えたいあなたに捧げるJohnsonのSU分布(実践編)

現実世界のデータには正規分布が当てはまらないことがあります。そんなときに役立つJohnsonのSU分布をpythonで実装する方法をご紹介!
スポンサーリンク
タイトルとURLをコピーしました