✅ Python prostředí připraveno! Využívá scikit-learn, scipy, NumPy pro robustní analýzy přímo v prohlížeči.
UMAP: zjednodušená implementace (Pyodide nemá podporu pro numba)
Vložit data (TSV z Excelu)
i
Formát TSV (Tab-separated values):
• První řádek: "Sample" + názvy vzorků (S1, S2, ...)
• Druhý řádek: "Group" + skupiny (A, B, Control, ...)
• Další řádky: název proměnné + hodnoty
Tip: V Excelu označte tabulku a zkopírujte (Ctrl+C), pak vložte sem.
📝 Načíst demo data
Desetinný oddělovač
i
Jak jsou zapsána desetinná čísla?
• Čárka (,) - český Excel, LibreOffice CZ
• Tečka (.) - anglický Excel, programování
Příklad: 1,23 vs. 1.23
Čárka (,) — český Excel
Tečka (.) — anglický Excel
Metoda analýzy
i
Dostupné metody:
• PCA - lineární, interpretabilní, rychlá
• PCoA - zachovává vzdálenosti mezi vzorky
• MDS - minimalizuje zkreslení vzdáleností
• t-SNE - nelineární, výborná pro clustery
• UMAP-like - zjednodušená implementace
Rychlá, zachovává lokální i globální strukturu
Poznámka: Pyodide verze bez numba závislostí
Doporučení: PCA pro první průzkum, t-SNE/UMAP pro vizualizaci clusterů.
PCA (Principal Component Analysis)
PCoA (Principal Coordinates)
MDS (Multidimensional Scaling)
t-SNE
UMAP-like (zjednodušená implementace)
Transformace dat
i
log2(x+1) transformace
Doporučeno pro:
• Omics data (genomika, proteomika, metabolomika)
• ICP-MS chemická data
• Data s velkým rozsahem hodnot (0.1 až 10000)
• Silně zešikmená rozdělení
Efekt: Stabilizuje rozptyl, redukuje vliv extrémů.
Bez transformace
log2(x+1) transformace
PCA škálování
i
Způsob škálování proměnných:
• Bez škálování - raw data, žádná normalizace
Proměnné s vyššími hodnotami dominují
• UV (Unit Variance) - standardizace na SD=1
Každá proměnná má stejnou váhu
Doporučeno pro různá měřítka (mg/L vs. %)
• Pareto - škálování na √SD
Kompromis mezi UV a neškalovanými daty
Zachovává částečně původní váhy
Bez škálování (raw data)
UV (Unit Variance)
Pareto (√SD)
⚙️ Pokročilé volby
PCoA metrika vzdálenosti
i
Jak měřit vzdálenosti mezi vzorky?
• Euclidean - klasická geometrická vzdálenost
• Correlation - vzdálenost = 1 - Pearsonovo r
Zvýrazňuje podobnost profilů/trendů
• Manhattan - součet absolutních rozdílů
Méně citlivá na odlehlé hodnoty
Euclidean (L2)
Correlation (1-r)
Manhattan (L1)
🚀 Spustit analýzu
🗑️ Vymazat vše
📥 Export Scores (CSV)
📥 Export Loadings (CSV)
Výsledky
📈 Diagnostika & Statistiky
📋 Souřadnice vzorků (Scores)