Kontrolní Seznam úplnosti ML

2025 Autor: Timothy Dodson | [email protected]. Naposledy změněno: 2025-01-22 21:27

S cílem zvýšit reprodukovatelnost a umožnit ostatním snadněji stavět na publikované práci představujeme kontrolní seznam úplnosti kódu ML. Kontrolní seznam úplnosti kódu ML vyhodnotí úložiště kódů na základě skriptů a artefaktů v něm uvedených.

Úvod

V loňském roce Joel Pino vydal kontrolní seznam reprodukovatelnosti, který má usnadnit reprodukovatelný výzkum představený na významných OA konferencích (NeurIPS, ICML,…). Většina položek v kontrolním seznamu se zaměřuje na součásti papíru. Jedna položka v tomto kontrolním seznamu je „poskytnout odkaz na zdrojový kód“, ale kromě toho bylo učiněno několik doporučení.

Osvědčené postupy byly shrnuty v kontrolním seznamu úplnosti kódu ML, který je nyní součástí oficiálního procesu odesílání kódu NeurIPS 2020 a bude k dispozici pro použití recenzenty, jak uznají za vhodné.

Kontrolní seznam úplnosti ML

Kontrolní seznam úplnosti kódu M kontroluje v úložišti kódů:

Závislosti - Má úložiště informace o závislostech nebo pokyny, jak nastavit prostředí?
Scénáře školení - Obsahuje úložiště způsob, jak trénovat / přizpůsobit modely popsané v dokumentu?
Scénáře hodnocení - Obsahuje úložiště skript pro výpočet výkonu trénovaných modelů nebo provádění experimentů na modelech?
Předtrénované modely - Poskytuje úložiště bezplatný přístup k váhám předtrénovaných modelů?
Výsledky - obsahuje úložiště tabulku / graf hlavních výsledků a skript pro reprodukci těchto výsledků?

Každé úložiště může přijímat od 0 (nemá žádné) do 5 (má všechny) klíšťata. Další informace o kritériích pro každou položku najdete v úložišti Github.

Jaký je důkaz, že položky kontrolního seznamu přispívají k užitečnějším úložištím?

Komunita obecně používá hvězdy GitHub jako proxy pro užitečnost úložiště. Očekává se proto, že repo s vyšším skóre na kontrolním seznamu úplnosti ML budou mít také více hvězd GitHubu. K testování této hypotézy bylo v dokumentech NeurIPS 2019 odesláno jako oficiální implementace 884 repozitů GitHub. 25% podmnožina těchto 884 repozitářů byla náhodně vybrána a ručně zkontrolována v kontrolním seznamu úplnosti ML. Seskupili tato ukázková repozitáře NeurIPS 2019 GitHub podle počtu klíšťat, která mají v kontrolním seznamu úplnosti kódu ML, a mapovali mediánové hvězdy GitHubu v každé skupině. Výsledek je níže:

Repozice NeurIPS 2019 s 0 zaškrtávacími políčky měly na GitHub medián 1,5 hvězdičky. Naproti tomu repo s 5 zaškrtávacími políčky měla medián 196,5 hvězd GitHub. Pouze 9% repo operací mělo 5 klíšťat a většina repo operací (70%) měla 3 nebo méně klíšťat. Byl proveden Wilcoxonův test součtu hodnot a zjistil, že počet hvězd ve třídě 5 ticků je významně (p.hodnota <1e-4) vyšší než ve všech ostatních třídách kromě 5 versus 4 (kde p.value je hranice). při 0,015). Data a kód tohoto obrázku můžete vidět v úložišti Github.

K otestování, zda se tento vztah rozšiřuje širší, byl vytvořen skript, který automatizuje výpočet kontrolního seznamu z úložiště README a přidruženého kódu. Poté jsme znovu analyzovali celou sadu úložišť 884 NeurIPS 2019, stejně jako širší sadu úložišť 8926 kódů pro všechny články ML publikované v roce 2019. V obou případech získali specialisté kvalitativně identický výsledek s mediánem hvězd monotónně rostoucích z klíšťat statisticky významným způsobem (p. Hodnota <1e-4). Nakonec jsme pomocí robustní lineární regrese zjistili, že předcvičené modely a výsledky mají největší pozitivní dopad na hvězdy GitHubu.

Toto je analytiky považováno za užitečný důkaz, že podpora výzkumných pracovníků, aby zahrnuli všechny komponenty vyžadované v kontrolním seznamu úplnosti ML, povede k užitečnějším úložištím a že skóre v kontrolním seznamu naznačuje lepší kvalitu podání.

V současné době odborníci netvrdí, že navrhovaných 5 položek kontrolního seznamu je jediným nebo dokonce nejvýznamnějším faktorem popularity úložiště. Popularitu mohou ovlivnit další faktory, například: velikost vědeckého příspěvku, marketing (např. Příspěvky na blogu a příspěvky na Twitteru), dokumentace (komplexní README, výukové programy a dokumentace API), kvalita kódu a předchozí práce.

Některé příklady úložišť NeurIPS 2019 s 5 zaškrtávacími políčky:

Odborníci uznávají, že ačkoli se pokusili vytvořit kontrolní seznam co nejobecnější, nemusí být plně použitelný pro všechny typy dokumentů, například pro teoretické nebo sady dokumentů. I když však hlavním účelem článku je představit datovou sadu, může stále těžit z vydání základních modelů, včetně scénářů školení, scénářů hodnocení a výsledků.

Začněte používat

Aby recenzentům a uživatelům usnadnilo pochopení toho, co je v úložišti, a odborníkům to správně vyhodnotit, je k dispozici kolekce osvědčených postupů pro psaní souborů README.md, definování závislostí a uvolnění předem připravených modelů, datových sad a výsledků. Doporučuje se jasně definovat těchto 5 prvků ve vašem úložišti a propojit je s jakýmikoli externími prostředky, jako jsou dokumenty a výsledkové tabulky, aby uživatelé měli větší kontext a jasnost. Toto jsou oficiální pokyny pro odesílání kódu do systému NeurIPS 2020.

Doporučuje:

Jak Zkontrolovat Kontrolní Součet Souboru

V dnešním světě lze stejný digitální obsah získat z různých zdrojů. Problém zajištění integrity použitých údajů je proto naléhavý. Snadný způsob, jak zkontrolovat integritu, je vypočítat a porovnat kontrolní součty. Můžete například zkontrolovat kontrolní součet distribučního souboru softwaru staženého ze sítě torrentů porovnáním s hodnotou zveřejněnou na webu vývojáře

Jak Snadné Je Vypočítat Kontrolní Součet CRC (CRC32 - CRC16 - CRC8)

Existuje mnoho možností pro výpočet kontrolního součtu CRC na internetu. Ale co přesně je kontrolní součet a proč se počítá tímto způsobem? Pojďme na to přijít. Instrukce Krok 1 Nejprve pojďme trochu teorie. Co přesně je tedy CRC?

Jak Obnovit Kontrolní Bod

Během provozu operačního systému Windows XP mohou nastat problémy, které nelze obvyklým způsobem odstranit, například odstranění systémových složek a souborů nebo změna velkého počtu parametrů samotného systému. Chcete-li obnovit systém do stavu, ve kterém byl před selháním, můžete zkusit použít nástroj Obnovení systému, který vrátí systémové soubory a nastavení do stavu, ve kterém byly v zadanou dobu

Jak Provádět Kontrolní Funkce

Funkce ovládání počítače provádí jeho správce. V závislosti na operačním systému, který používáte, tento uživatel vykonává stejné funkce, ale nebude se přihlašovat ke svému účtu stejným způsobem. Nezbytné - Heslo správce. Instrukce Krok 1 Chcete-li vrátit funkce správy počítače, přejděte do operačního systému pod názvem účtu správce

Jak Zjistit Kontrolní Součet Souboru

K ověření pravosti souborů distribuovaných přes internet se na mnoha webech vedle odkazu ke stažení publikuje kontrolní součet, nejčastěji ve formě hash MD5. Chcete-li ověřit pravost nahraného souboru, musíte zjistit jeho kontrolní součet. Vzhledem k důležitosti tohoto úkolu jsou funkce výpočtu kontrolních součtů zahrnuty do softwaru pro práci se soubory

Kontrolní Seznam úplnosti ML

Obsah:

Úvod

Kontrolní seznam úplnosti ML

Jaký je důkaz, že položky kontrolního seznamu přispívají k užitečnějším úložištím?

Začněte používat

Doporučuje:

Jak Zkontrolovat Kontrolní Součet Souboru

Jak Snadné Je Vypočítat Kontrolní Součet CRC (CRC32 - CRC16 - CRC8)

Jak Obnovit Kontrolní Bod

Jak Provádět Kontrolní Funkce

Jak Zjistit Kontrolní Součet Souboru

Jak Nainstalovat Ovladač Pro Zvuk Ve Vysokém Rozlišení

Jak Vytvořit Složku, Soubor V Roce

Jak Vyčistit Zbytky Pevného Disku

Jak Chránit Počítač Před Vetřelci

Co Dělat, Když Počítač Nevidí Obsah Jednotky Flash

Jak Získat číslo Na Skype

Jak Odstranit Historii Pouze Jednoho Kontaktu Ve Skypu

Jak Odstranit Historii Na Skype

Jak Mazat Zprávy Na Skype

Jak číst Příběh Agenta

Co Dělat, Když Se Desktop Nenačte

Jak Opravit Outlook Express

Jak Převést Textové Formáty

Jak Převést Datum Na Text

Jak Převést Vektorový Obrázek Na Bitmapu