Différences

Ci-dessous, les différences entre deux révisions de la page.

--- python:pandas [2023/07/07 18:38] – [Agréger] add rename columns with multiple index phsw
+++ python:pandas [2023/10/30 12:26] (Version actuelle) – [Renommer des colonnes] add how to name column phsw
@@ Ligne 22: / Ligne 22: @@
 <code python>
 print(df.to_markdown())  # il faut installer le paquet tabulate / python3-tabulate
+</code>
+ou bien :
+<code python>
+pd.set_option("display.max_columns", None)
+pd.set_option("display.max_rows", None)
+pd.set_option("display.width", None)
+</code>
+Pour afficher le dataframe en arrondissant :
+<code python>
+print(df.round(2))
 </code>
@@ Ligne 96: / Ligne 107: @@
 <code python>
 df['name'] = df['name'].apply(lambda s: s.replace("_STARPU_", "").replace("FUT_", ""))
+</code>
+==== Minimum ligne par ligne de deux colonnes ====
+[[https://stackoverflow.com/questions/16989946/creating-an-element-wise-minimum-series-from-two-other-series-in-python-pandas|Source]]
+<code python>
+pandas.concat([s1, s2], axis=1).min(axis=1)
 </code>
@@ Ligne 104: / Ligne 124: @@
 to_plot = df.sort_values(by=['name'])
 </code>
+S'il y a plusieurs niveaux de colonnes, il faut utiliser des tuples : ''by=[('Percentage', 'mean')]''.
+''ascending=False'' pour avoir un tri décroissant.
@@ Ligne 192: / Ligne 216: @@
 </code>
+Il possible de fournir une liste de colonnes.
@@ Ligne 214: / Ligne 239: @@
 df_starts.rename(columns={"Time start": "Time"}, inplace=True)
 </code>
+Pour des colonnes qui n'avaient initialement pas de nom :
+<code python>
+df.columns = ["A", "B", "C"]
+</code>
+==== Éclater une colonne textuelle en plusieurs colonnes ====
+[[https://stackoverflow.com/questions/14745022/how-to-split-a-dataframe-string-column-into-two-columns|Source]]
+Si les valeurs de la colonne ''Configuration'' sont de la forme ''baseline.C.openmpi.linear.1'' :
+<code python>
+df[['Type', 'Size', 'MPI', 'Coll', 'Iter']] = df["Configuration"].str.split('.', expand=True)
+</code>
@@ Ligne 265: / Ligne 307: @@
 <code python>
 value = df.at[0, "P"] # [numéro de ligne, nom de colonne]
+</code>
+=== Convertir en dictionnaire une unique ligne ===
+<code python>
+assert(len(row) == 1)
+row = row.squeeze().to_dict()
 </code>
@@ Ligne 289: / Ligne 339: @@
     12 13
     14 15
+</code>
+==== Fonction inverse d'un percentile ====
+Pour connaître quelle est la proportion de valeurs qui sont inférieures à ''x'' ([[https://stackoverflow.com/questions/26489134/whats-the-inverse-of-the-quantile-function-on-a-pandas-series|source]]) :
+<code python>
+(df < x).astype(int).mean()
 </code>