データサイエンス Matplotlib | Python作図での軸のスケール設定の必要性(Python軸スケール 1. 知識編) 作図において軸のスケールを設定する必要性についてお話します!データによっては線形スケールではなくLogスケールなどに設定する必要があります。今回は線形、Log、Symlogスケールを使うべき場面を例をあげて解説します! 2024.06.28 データサイエンス
データサイエンス Matplotlib | Pythonで散布図を1次元ヒストグラムと同時にプロットする方法(Python散布図 4. 応用編) Pythonで綺麗な散布図を描く方法の第4回です!2次元の散布図上の点の密度をカラーで表示する「密度カラー散布図」の描画方法をご紹介します。今回は密度カラー散布図と同時にx, y各軸の1次元ヒストグラムをプロットします! 2024.05.07 データサイエンス
データサイエンス Matplotlib | Pythonで綺麗な2次元散布図の実装方法(Python散布図 3. 基礎編) 2次元の散布図上の点の密度をカラーで表示する「密度カラー散布図」の実装方法をご紹介します。まずは基礎編として、前回紹介した8つの描画方法を関数として実装します。 2024.04.28 データサイエンス
データサイエンス Matplotlib | Pythonで綺麗な2次元散布図を描く方法(Python散布図 2. 理論編) 2次元の散布図上の点の密度をカラーで表示する方法8つをまとめてご紹介!密度カラー散布図の描き方は、密度計算の方法やスムージング、個々の点への密度の割当方法で8つに分類することができます。今回はこれらを網羅的にご紹介します。 2024.03.25 データサイエンス
データサイエンス Matplotlib | Pythonで綺麗な2次元散布図を描く方法(Python散布図 1. 概要編) Pythonで綺麗な散布図を描く方法をご紹介します!2次元の散布図を描くとき、点の数が多いと密集した場所が潰れて見えないことがあります。散布図上の点の密度をカラーや等高線で表示することで、綺麗な散布図を描くことができます。 2024.02.23 データサイエンス
データサイエンス NumPyレシピ | 全ての組み合わせについての計算はnp.ufunc.outerで! NumPy配列の要素同士の全ての組み合わせについて計算を行う方法を紹介します。例えば、2つの配列の要素同士の全ての組み合わせについて差分などです。np.ufunc.outer()を使う方法、np.meshgrid()やnp.tile()で2次元化する方法を比較します。 2023.09.10 データサイエンス
データサイエンス NumPyレシピ | aのx乗(a^x, a**x)はどの方法が高速か? aのx乗を高速に計算する方法を紹介します。Pythonでは、a**xやnp.power(a, x)など実装方法がいくつかあるので、計算速度を比較します。計算速度が速いnp.expを使ってa**xを計算する方法も取り入れます! 2023.09.05 データサイエンス
データサイエンス NumPyレシピ | np.exp(x)はe**xよりも2倍ほど高速! Pythonでexp(x)を高速に計算する方法を紹介します。Exponential(exp(x)やeのx乗)の計算は統計学やデータ解析で頻出の計算です。Pythonでは、numpy.expやe**xなど実装方法がいくつかあるので、計算速度を比較します。 2023.09.04 データサイエンス
データサイエンス NumPyレシピ | 複数のベクトルのノルム(大きさ)はnp.linalg.normで高速計算できる! 今回はPythonデータ解析、複数のベクトルのノルムを高速に計算する方法です。ノルムの計算については複数のベクトルでもnp.linalg.norm()というメソッドを用いて計算することができます。速度的にもnp.linalg.norm()で十分です。 2023.03.29 データサイエンス
データサイエンス NumPyレシピ | 複数のベクトル同士の内積は成分計算するのが速い! 今回はPythonデータ解析、複数のベクトル同士の内積を高速に計算する方法です。一つのベクトル同士の内積はNumPyのnp.dot()でできますが、np.dot()では複数のベクトル同士の内積を一度に計算することはできないため、高速に計算するには工夫が必要です。 2023.03.27 データサイエンス