Debata s vědci na festivalu AFO o prolínání biologie, genetiky a lékařství s umělou inteligencí. Pozvání přijali Vojtěch Bystrý, Stanislav Fort, Jan Pačes a Karla Plevová
Pokročilá umělá inteligence má potenciál změnit většinu oborů lidské činnosti. V biologii ovšem nemění nic menšího než náš přístup k proteinům a základnímu kódu života. Umělá inteligence odhaluje chyby v DNA, otevírá nové hypotézy, pomáhá ve vývoji nových léků, ale může posloužit i jako klíč k Pandořině skříňce s dosud netušenými biologickými zbraněmi v podobě smrtících virů a toxinů. Pochopí AI kód života? Co jí v tom může zabránit? Jaké nové možnosti, výzvy i hrozby tento dialog otevírá? A před čím by se měl zastavit? Na debatě s Respektem na festivalu AFO v Olomouci o tom diskutovali biologové a experti na AI Karla Plevová, Jan Pačes, Vojtěch Bystrý a Stanislav Fort. Moderovali Štěpán Sedláček a Martin Uhlíř.
Přepis textu – RESPEKT - Umělá inteligence luští v DNA kód života.
Vítejte na debatě týdenníku Respekt na festivalu AFO v Olomouci s názvem Kód života psaný umělou inteligencí. Já jsem Štěpán Sedláček a moderovat tuhle debatu budu spolu s kolegou vědeckým novinářem Martinem uhlířem. Eh, o tom, že umělá inteligence může změnit většinu oborů lidské činnosti, včetně těch uměleckých právě i díky rozšíření jazykových modelů asi dnes už pochybuje málokdo. Biologii a oblasti přírodních vět obecně ovšem může tedy dopomoct e k přečtení, možná i změně asi toho nejcennějšího korpusu písmenek a sice tedy za základních kódů života. E, otázka je, jaké bariéry tam jsou a co to může ve výsledku změnit. E, protože může pomoct otevřít nové hypotézy, odhalovat třeba chyby v DNA, pomoct ve vývoji nových léků, ale i třeba jedů nebo biologických zbraní. I o tom dnes bude řeč. Já jsem si všiml, že zrovna tento týden v pondělí o tom referoval americký denník New York Times o zveřejnění informací ze startupu. Profluent, který tedy vytváří genový editor na základě dat využití Krisprů, tedy těch genových nůžek, které dokážou už 10 let nebývale přesně měnit, zasahovat do genetického kódu a upravovat ho. No a podobné zprávy přicházejí jako na běžícím pásu právě díky tomu zrychlení ve vývoji umělé inteligence posledních let. No a o prolínání umělé inteligence, biologii a ale i lékařství. Tedy budeme dnes mluvit s povolanými zástup které za chvilku představíme z různých oborů, ale teď ještě dám slovo Martinovi, který k tomu má doplnění.
Dobrý den. Já bych jenom doplnil takovou příhodu nebo ilustraci, která by to nějak lépe přiblížila. Bylo to roku 1889, kdy jistý francouzský lékař sestoupil z vysoký Hor z Alp a dal kapku své krve pod mikroskop a zjistil, že mu přibylo tím pobytem ve vysokohorském prostředí červených krvinek a spekuloval o tom, že v těle musí existovat nějaký mechanismus, který když je vystaveno nedostatku kyslíku, tak množství tady těch červených krvinek roznášejících kyslík zvýší a buňky, které jsou u zrodu tady toho mechanismu, se podařilo objevit teprve loni jistému izraelskému týmu. Poté to vyzkoušela umělá inteligence podobná tedy těm jazykovým modelům eh typu chat GPT, akorát vytrénovaná tedy v biologii, genetice a genetickém profilu buněk a ta to zvládla za šest týdnů. Takže v jistém smyslu se dá říct, že to, co lidstvu trvalo 134 let, tak umělá inteligence zvládla takhle rychle, aniž jí kdokoliv řekl, jaké jaká ty data vlastně, kterými je krmená, mají funkci, tak ona na jejich základě dokázala roztřídit buňky asi na 1000 typů a ty buňky produkující hormon, který je za tady tím mechanismem, byly mezi nimi. Tak to jenom pro ilustraci a tady bychom mohli ještě páne představit naše hosty.
Tak po mé levici je Vojtěch Bystrý z vědecko výzkumného centra Ceitec v Brně, Masarekovy univerzity, kde tedy vede centrální bioinformatickou laboratoř. Ta se mimo jiné věnuje vývoji počítačových aplikací na zpracování dat získávaných ze sekvenování DNA nové generace pro klinické účely. Vystudoval aplikovanou informatiku na Maserikově univerzitě. Dobrý den. Díky, že jste přijal pozvání.
Dobrý den. Děkuju. Dále je to molekulární genetik, který zkoumá strukturu genomů v ústavu molekulární genetiky Akademie věd České republiky. Jan Pačes. Ten mimo jiné sestavil databázi lidských endogenních retrovirových elementů. Vystudoval biochemii na univerzitě Karlově a mikrobiologii na VŠCHT, kde přednáší bioinformatiku. Také vím, že je pravidelným hostem a popularizátor vědy na Českém rozhlase. Dobrý den, vítejte.
Dobrý den. A já bych doplnil po mé pravici Karlu Plevovou, eh, molekulární genetičku, která působí na lékařské fakultě a institutu Cejtek Maserikovy univerzity a také ve fakultní nemocnici Brno. Věnuje se genetice a molekulární biologii. Působila mimo jiné v evropské molekulárně biologické laboratoři EMBL v Heidelbergu a loni se stala spoludržitelkou ocenění Masarikovy univerzity Muni Innovation Awards. za vývoj nového diagnostického testu pro hematoonkologii. Dobrý den, děkujeme, že jste přišli.
Dobré odpoledne. Děkuju za pozvání.
A konečně je to Stanislav Ford, expert na umělou inteligenci a velké jazykové modely, který působil například se podílel na vývoji e modelu společnosti Anthropic Cloud. Vedl vývoj open source jazykových modelů pro stability AI. Působil v Google Break. nyní pracuje jako seniorní výzkumník, eh, který zkoumá bezpečnost a pochopitelnost umělé inteligence v Deep Mind. Má doktorát v oboru umělé inteligence ze Stanfordovy univerzity a vystudoval fyziku, teoretickou fyziku na univerzitě v Cambridgei. Čili vidíte, že jeho stručné CV zahrnuje ty nejznámější firmy v oboru umělá inteligence. Děkujeme, že jste přišel. Dobrý den.
Dobrý den. Moc děkuju za pozvání. A pustíme se do toho. Já jenom předešlu, že podstatnou část boru můžou tvořit i vaše otázky, na které bude prostor. Na úvod takové kolečko, t až 5 minut každý z vás. Zajímá nás, jakou roli hraje umělá inteligence v tom vašem oboru a v aktuálním výzkumném poli, v tom, e, čím se zabýváte během vašich výzkumů nebo vývoje. A můžete k tomu i přidat, eh, co třeba máte teď na srdci v souvislosti s tou umělou inteligencí, co vám přijde vlastně nejdůležitější. Tak Tak to říct takhle na úvod a nevím, jestli mám někoho vytáhnout nebo se někdo do toho chce pustit sám jako první.
Jan Pače se přihlásil. Máte slovo.
Děkuju. Tak já jsem bioinformatik a to znamená, že ačkoliv studuju vědy o životě, tak jsem nic živýho už letad neviděl. Jenom doma mám kočku. Je to opravdu všechno jenom počítačová záležitost. No a ta technologie poslední doby umožnila číst vlastně jednoduchým způsobem DNA a to pro biologii má obrovský význam, protože víme, že DNA je to místo, kde se uchovává informace a o tom, jaký ten organismus bude, to je to, co předáváme našim potomkům, co jsme získali od našich předků. A i velká řada třeba onemocnění může souviset s tím, že v té DNA je něco zaznamenáno, co třeba zrovna dobře nefunguje. No a já se specializuju nejenom na tenleten eh vertikální přenos DNA, teda z předku na potomky, ale i ten horizontální, co ex Existují různé způsoby eh toho, jak podstrčit tu genetickou informaci nějakému organismu. Nejznámější a to všichni známe, jsou viry, které prostě sami o sobě ani nežijí, ale pořád tu informaci životní nesou a dokážou jí podstrčit živým buňkám a které za ně potom udělají tu práci. No a ta umělá inteligence nebo ty neuronové sítě se v biologii používají už poměrně dlouhou dobu. Biologové je nemají moc rádi nebo neměli je moc rádi do nedávna, protože e my jsme natrénovali takovou síť třeba na to, aby hledala, kde jsou v DNA zapsaný geny. To jsou programy, který jsou starý třeba 15 let a oni to dělají docela dobře. Problém je, že my nevíme pořádně, proč to tak udělali. A v tý vědě hodně často nás zajímá nejenom ten nástroj, ale také proč to tak je. A to nám ty neuronový sítě úplně dobře neumožňovaly. Takže ta ta nejistota v tom, co vlastně ta neuronová síť takhle objevila, e, tam byla poměrně velká. Ale to se tedy změnilo. e během posledních možná roků teprve v okamžiku, kdy jak tady asi uslyšíme, do toho celého oboru vstoupila ta AI generativní a velké jazykové modely, které pochopitelně jednak vědcům umožňují lépe pracovat s tím obrovským množstvím informací. Já to používám na to, že nejsem moc dobrej programátor, tak mi to pomáhá opravovat ten kód nebo mi to doporučuje funkce a výrazně mi to urychlilo práci a na to je třeba hrozně dobrá. Ale to, co si od toho velmi slib A o čem bych tady dneska si chtěl s váma povídat taky je, že nám to umožní vnímat tu DNA taky jako jazyk. Vlastně DNA je pořád totéž, co je přirozený jazyk z hlediska toho, že to je lineární řetězec informací, ze kterých jsme postaveni. Takže to je jasná informace, ale ten jazyk tomu úplně přesně nerozumíme a tady doufáme, že nám ta AI v tom udělá nějaký prostě významné významné objevy nebo změnu paradigma to změnu pochopení toho, jak to vlastně s tou DNA, s tou informací o životě je.
Vojtěk byste jí naváže?
Můžu navázat. Já jsem tedy taky bioinformatik, tak vlastně oborově to stejné eh jde o to nějak na počítači zpracovat, jak bylo řečeno, ty přečtené písmena ACGT, e, ten kód toho té DNA. A, eh, my děláme hlavně pro klinické účely, kdy se snažíme odhalit z toho genotypu vlastně nějaký ten fenotyp té nemoci. To znamená, jestli jaká je význam nějaké eh varianty nebo nějaké mutace. v DNA a velmi se mě líbilo, jak pan kolega Pačes tady říkal vlastně o tom, že ty neuronové sítě už jsou tady dlouho, protože opravdu jako to, čemu dneska se říká umělá inteligence, e, před pár lety se tomu ještě říkalo strojové učení, tak už je tady jako delší dobu. Vždycky byl problém té vysvětlitelnosti. Ten si myslím, že pořád ještě není překlenut a tam si myslím, že ještě bude eh docela to bránit eh v určitých směrech, obzvlášť v klinice, v tomu vývoji. A eh rád bych se dneska taky pobavil, protože poslední dobou nad tím hodně přemýšlím, jestli vlastně je možné, tak jak se natrénoval teďka ten velký language model na jazyku a různých jazycích a dokáže vlastně podchytit nejen jazyk samotný, ale vlastně trošku aj stylem přemýšlení, protože vlastně simuluje trošku to lidský mozek, že jo, ty neurony a to myšlení. Tak jestli pro tu DNA dokáže platit něco podobného, protože vy jste říkali že DNA je v zásadě jako jazyk. Ano, jsou to písmena lineárně poskládaná. Na druhou stranu to, co se bralo ještě před 20, 30 lety, já jsem se to tak učil, je to krásné vysvětlení toho, jak nebo krásná ilustrace té DNA, že je to vlastně taková kuchařka, já říkám, jo, kde si pak přečtou ty recepty a potom ty rybozomy, to jsou ty kuchaři, tak ti vyrobí ty proteiny, ty jednotlivý a a a to pak něco dělá. A ono se zjišťuje, že to úplně tak není, že celá ta buňka a celej ten molekulární mechanismus funguje daleko složitěji, než jen tady jako přímým vlastně postupem. A eh nejsem si jist, jestli vlastně to, když simulujeme něco, co má představovat náš mozek, tak jestli je to optimální na simulaci té buňky. A na to bych se rád kolegů rozhodně zeptal.
Paní doktorka Plevová.
Tak já navážu, já si připadám tady trochu v menšině. e a nejenom pohlavím, ale i ale i eh zaměřením svojí práce. Já jsem původně vystudovala biofyziku a molekulární biofyziku na přírodovědecké fakultě, ale eh vlastně hned po magisterském studiu se převážila vlastně ta bio eh část v mém já oproti té fyzice. A je pravda, že už v prvním ročníku mě e v té v mechanice paní profesorka řekla u zkoušky, že jsem spíš intuitivní fyzik, ale eh každopádně já jsem eh spíš e na straně opravdu té biologické a na straně molekulární biologie a genetiky a vlastně eh postupem času jsem se začala čím dál tím víc věnovat diagnostice zejména v onkologii nebo konkrétně v hematoonkologii, kdy hledáme různé diagnostické markry a to hlavně na úrovni DNA, protože eh studujeme vlastně sekvence eh lidské DNA v těch nádorových buňkách. Eh, většinou jsou to změny, které eh tedy nejsou zděděné od rodičů, ale vznikají nově v té DNA, v těch nádorových buňkách a vlastně charakter a vůbec e počet těch změn může ovlivňovat to, jakým způsobem se bude vyvíjet to onkologické onemocnění daného pacienta. A to nás zajímá. Snažíme se najít nejlepší cesty, jak to určit jak to využít právě pro diagnostiku a tam už potom právě narážíme na to, že i když si člověk vzdá trochu těch výpočtů, tak zároveň se k nim dřív nebo později vrátí, protože v dnešní době molekulární biologie a genetika je v podstatě neoddělitelná od bioinformatiky a je potřeba už využívat nástroje, které umí zpracovat obrovské množství dat a proto právě eh využíváme různé bioinformatické nástroje a už i AI nástroje a už i v diagnostice se dá říct, že do té diagnostiky ta AI problematika proniká a pořád je to podle mě pro řadu lidí neznámá nebo v té diagnostice furt je to velká neznámá, protože sice víme, že to má velké možnosti, ale jaké konkrétně to až tak úplně jasné pro řadu lidí není. Takže Takže to je to je moje pole eh působnosti a eh já ai říkám, že přesto, že to může být pro řadu lidí na začátku nepřítel, tak je dobře ze svého nepřítele udělat přítele a naučit se ho využívat ve v prospěch vlastně eh diagnostiky a lidí a lidského zdraví.
Děkujeme. A pan Ford, máte slovo. E
moc děkuji za tahleta představení. Já na rozdíl od mých spoluparalistů tady nejsem biolog, nemám žádný biologický background, jsem spíše intuitivní biolog rigorózní biolog, ale můj background původně je ve fyzice. A eh já jsem se k AI dostal tak, že eh jsem si říkal, jaký je ten eh nejpodstatnější problém na s kterým bych mohl pracovat a říkal jsem si, že automatizace řešení problémů jako samotného, ten metaproblém řešení problémů, což je to, co dělá AI, co dělá lidský mozek, je to, co bych asi měl dělat. Moje práce na teoretické fyzice by pravděpodobně vedla k nějakým dílčím pokrkům v tom oboru, ale vyřešit ten metaproblém toho, jak se vlastně problémy řeší obecně, mi přišlo jako větší problém, e, na který se zaměřit. Takže tak jsem skončil v umělé inteligenci a pro mě umělá inteligence je ten hlavní předmět zájmu, nejenom analýzy, ale také vývoje. Takže já se věnuji tomu, že je stavím, trénuji, navrhuji. Takže se věnuj tomu věnuji tomu, jak je zlepšovat, ale můj hlavní výzkumný program souvisí s tím, že se snažím vysvětlit, jak interně fungují. Takže kolegové tady zmínili eh tu interpretovatelnost toho, jak ta, jak ten systém nějak generuje ty výsledky. Eh můj ultimátní zájem je mít něco takového pro umílou inteligenci obecně a chápat, jak produkuje ty odpovědi, které produkuje na nějaké úrovni, která mi brala by mi dala vhled toho, co dělají a jaké potenciální chyby dělat mohou. Takže to je zhruba tomu, čemu se věnuji. A jazykové moraly jsou jeden ten pilíř toho, čemu se věnuji, protože Momentálně jsou to ty asi nejchytřejší systémy na světě a zdá se, že fungují jako něco, co by se mohlo nazvat prefrontálním kortexem lidského mozku. Taková asociativní difuzní mašina, která je spíše než umělou inteligencí, umělou intuicí, což se zdá, že je ten těžší problém. A na základě ní můžeme postupně bupovat i logičtější, rigidnější, matematičtější systémy. Ale můj konkrétní zájem dnes je pochopit přesně, jak fungují tady ty umělé intuice nebo umělé inteligence, protože už dnes jsou potenciálně stejně dobré jako typický člověk ve většině doben, které intelektuálně řešíme a možná i o hodně lepší. Takže myslím si, že jako momentální teď jsme v době, kdy jsme víceméně v paritě s umělými inteligencemi, což asi nebude dlouhý moment v historii, ale e to pro mě ještě víc zdůrazňuje to, jaká je urgence toho pochopit, jak fungují.
Já bych možná navázal takovou doplňující otázkou, která tady vlastně už zazněla a která mi přijde mimořádně zajímavá a eh to je, že pan Bystrý zmínil to, že jaksi my vidíme, že v té bunce je to všechno složitější a nevím, jestli jestli ještě platí vůbec to centrální dogma biologie, že DNA dělá RNA a ty dělají proteiny. Eh, a že vlastně vy jste se ptal, jestli něco systémy, jako jsou třeba ty generativní modely, které nějakým způsobem napodobují činnost lidského mozku, se vůbec hodí k nějakému hlubšímu pochopení eh toho, co se odehrává v té bunce. Vy jste zmínil, že to je spíše umělá intuice, než umělá inteligence, takže hodí se k tomu nebo ne?
Já bych řekl, že skoro určitě, že asi libovolná sekvence eh symbolů, která v sobě má nějakou pravidelnost. E ta pravidelnost je potenciálně objevitelná automaticky pomocí umělé inteligence. To je podle mě ten největší potenciál toho, co umělá inteligence dělá, což je jakoby vytváření efektivních teoretických popisů na té správné úrovni komplexity. Abych se vrátil ke svému fyzikálnímu začátku, tam se mi zdálo, že ten hlavní filozofický komitment, co máme, je redukcionismus, pochopit co nejhlubší zákony v těch nejmenších struktur a z nich extrapolovat nahoru po tom žebříčku eh zo toho jako zoomování od toho systému. Problém je, že typicky popis kvarků, elektronů, protonů není vhodným jazykem pro popis třeba vln na moři nebo nějakého jako emergentního systému, který nás reálně zajímá. A myslím si, že umělá inteligence je právě automatický způsob, jak objevit nějaké efektivní závislosti a popis na té správné úrovni komplexity. Takže podle mě tam je velký potenciál najít nějak automaticky ty vzorce. I když si myslím, že pravděpodobně DRA je díky evolučním tlakům, které eh byly na ní, já jsem hodně amatérský biolog, takže jak si to představuji, je, že ty constraints, které používala evoluce jsou hodně jiné než to, jak vznikal jazyk. A tudíž je možné, že ta informační hodnota a způsob zápisu informací v rámci DNA je hodně jiný a že se to možná podbá více nějakému zašifrovanému textu, než jako textu, který se snaží přenést co nejvíc informací nejefektivějším způsobem. Takže si myslím, že je tam jako nějaká empirická otázka kolem tady toho, ale nemyslím si, že je nějaká fundamentální bariéra, proč bychom neměli informačně bohatou sekvenci e pochopit automaticky pomocí modelů, které jsou dobré v chápání lineárních sekvencí, což jsou jakoby ty jazykové modaly, které máme. Ten jazyk je tam druhotná věc, na které zas tolik nezáleží. Je to spíše jedna z možných sekvencí. Úplně stejně to chápe matematiku, programování nebo jiné typy zápisu kódu.
Měl jsem dojem Jana Pačesa, že by chcete reagovat?
Musím, nemůžu to vydržet. Eh jo, jasně. Je to lineární záznam informace. Problém, kterej by mě zajímal, jak na to tyhlety systémy reagujou, je, že v DNA neseme obrovský množství starý zátěžek, která se postupně rozmazává a ne jaksi jí nezbavujeme. Přitom to není randomníš Tak jsou to věry třeba, který nás napadly, naše předky, ale předky, který máme společný třeba se šimpanzem a ještě ještě dále do historie a sedí v tý naší DNA a je jich tam dokonce víc než to, co kóduje proteiny. Tak jenom pro představu, pro ty, který už to zapomněli ze školy, tak DNA člověka má 3,3 miliardy písmenek ve dvou teda kopiích. Všichni jsme si z 99,9 % podobní, ale z těch 3 miliard jenom 2 % je záznam nějak nějakýho proteinu, kterej potom dělá barvu očí nebo nattahuje svaly nebo staví kosti. Ale těch 98, tak tam jsou ještě nějaké regulační oblasti, které to zapírají ve správný okamžik. Ale jeden zbytek to jsou relikty historický, prostě nepořádek jako na půdě nebo v šuplíku, kterej ten genom neumí uklidit a tak tam postupně jako stárne a degraduje. Takže ta otázka, kterou třeba vlastně teďka v tý biologii řešíme, na čem by se takovýhle umělý inteligence měly trénovat i na tomhle tý degradov informaci a nebo je potřeba napřed vzít opravdu tu, který rozumíme. Tak to to mě to miá hrozně napínavý, jako jak to je.
Můžu jenom ta degradace je zajímavej aspekt, protože ta data, na kterých se třeba velký jazykový model jako GPT4 přetrénovává, jsou extrémně náhodná a extrémně špatná. Takže je tam docela analogická situace v tom, že typická věta nebo typických 1000 slov z té datové sady pro předtrénink těch modelů by vypadala jako náhodná konverzace mezi eh lidmi na Reditu nebo něco takového a a informační hodnota tady těch věcí nebo velká část z nich jsou nějaké lineární zápisy tabulek třeba z Excelu nebo úplně náhodný v podstatě šum. Ta informační hodnota na každou tu větu je extrémně nízká, ale zdá se, že ten jazykový model během toho tréninku, aspoň moje interpretace je, že získá něco jako fragmenty kognice, nějaké elementární kognitivní operace, které se pak dají složit dohromady do něčeho komplexnějšího a ty další fáze toho tréninku, které jsou o hodně omezenější a mají o hodně menší množství dat, ale o hodně kvalitnějších dat, tak ty pak vedou k tomu, že se to nějak syntetizuje do hromady v něco, co se chová jako konzistentní osobnost a přemýšlí to lidským způsobem. Ale ty fragmenty eh těch vzorců, které jsou podle mě ty fundamentální dílky, ze který se skládá e to chápání toho modelu později, přichází z relativně nízkok kvalitního textu na začátku. Takže si myslím, jedna otázka je množství toho textu nebo množství těch dat. To by mohl být velký botlnek, ale pokud jde o kvalitu, tak ten typický e trénovací set pro jazykové mely také není moc kvalitní. Obsahuje hodně nějakého eh harampádí, jak jste zmínil,
takže se máme na co těšit.
Uvidíme. E po Vojtěch bystrý.
V tomto směru by mě přesně zajímalo, jestli tam není problém v komplexitě těch základních stavebních kamenů, kdy u toho jazyka přece jenom to slovo je nějak dáno a bylo vymyšleno lidmi ne až tak dávno a poměrně jednoduchým způsobem. Zatímco na úrovni té DNA, tam vlastně ty nejmenší fragmenty, my jsme si mysleli, že je známe a teď jsme zjistili, že je vlastně moc neznámé. Ono to dává trošku smysl, protože tady vlastně asi 500 milionů let náhodně se jenom tak šoupalo do toho a ty buňky se nějak tvořily a úplně vlastně jenom to, co fungovalo, tak jako probíhalo dál. A já se nejsem jistej, jestli vlastně na úrovni úplně té nejnižší vrstvy je tam něco, co je odhalitelné jako základní principy na úrovni celé DNA. Na úrovni proteinu tam celkem evidentně je, protože už existuje Alphafold a funguje to velmi dobře, ale na té komplexní, že by se dokázal zdnát celý ten fenotyp, já doufám, že jo. Ale nejsem si úplně jist, jestli se do toho nebude muset zapojit i nějaká kvantová mechanika na na úrovni té buňky. Fakt nevím. A druhá věc je teda, že za eh že na úrovni množství těch dat jsme ještě jako strašně pozadu, jo, protože když bereme na čem se trénoval eh třeba GPT, nějaký ty kohorty, e já přiznávám se, že nevím kolik to je, ale jsou to
15 trilionů tokenů pro Lamu 3 teďka nejnověji.
No, ale ale kolik jako kdyby tak textu e je tam dát
eh možná 1000 Wikipedií e nebo něčeho takového.
Jo a teďka v tuto chvíli, jestli máme nasekvenováno, kdy tak milion genomů na světě, možná dva už budou, tak to to je prostě úplně jako ještě ještě procento toho, co co by bylo potřeba, si myslím. Takže i ještě to není ani jako otázka, ale i když ty data budou, tak si nejsem jist, jestli to, jak je nastaven model, ta neuronová síť, jestli principiélně vlastně dokáže toto rozlišit.
Paní Bvová, ano,
já jsem na to chtěla zareagovat, protože že my se vlastně pořád bavíme o lineární DNA, ale e ono je to ta vlastně ta DNA není lineární v té buňce a ve chvíli, kdy se právě do toho přidá to, že ta DNA je v té buňce nějakým způsobem smotaná a to jakým způsobem je smotaná určuje to, jakým způsobem se přepisuje. Ono to centrální dogma molekulární biologie, že z té DNA to jde do té RNA a pak až do těch proteinů, tak pořád vlastně platí. A eh díky tomu, že ta DNA je nějak stočená a může interagovat e nějaký element, který ovlivní, jestli se konkrétní gen bude přepisovat nebo ne, tak to nám vlastně jako ta lineární sekvence úplně neřekne a to přidává tu další velmi výraznou komplexitu eh do toho problému. A proto si myslím, že to nebude, neříkám, že to není reálné, možná to někdy v budoucnu bude reálné, ale to si myslím, že to je to, co výrazně zesložiť eh tu situaci a a eh zkomplikuje to, aby ta buňka šla nějakým způsobem namodelovat
tohle. I ještě se k tomu vrátíme tady k těmhletěm teoretickým otázkám, komplexitě a podobně, ale já bych vás možná vyzval, jestli byste nejdřív nám, lajkům nepředstavili, co se teda už povedlo. E jste zmínil třeba Alpha Fold, četli jsme o tom, že vlastně Krisper, metoda genetických modifikací, už využívá umělou inteligenci pro návrh právě toho systému. Tak jestli byste mohli představit publiku, kde už ta umělá inteligence do té biologie vstoupí, A a čem i těch bystrý,
pokud nebereme trénovaná data na eh jazyku, tak asi ten největší impakt poslední doby ostatně je ten Alpa Fold, což je nástroj natrénovaný, který dokáže předpovědět právě ze sekvence proteinů. To znamená posloupnost těch aminokyselin, které se zase dají už přímo přeložit. To ten genetický kód, to známe už 80. let. E se dají přímo přeložit z toho písmenek genů se přeloží písmenek aminokyselin a na základě toho pak to byl takovej ten svatý Ál té molekulární biologie si pamatuju ještě někdy koncem 90. let, kdy jsem nastupoval na školu, tak to bylo takový, že kdo vyřeší, jak poskládat tu 3D strukturu z té 1D sekvence, takže to bude prostě výhra. A to se teďka podařilo a nepodařilo se to na základě toho, co si hodně lidí myslelo, že to tak půjde, že pomocí nějaké kvantové dynamiky vlastně nasimulujeme, jak se ty molekuly těmi vazbami tam skládají. Ale místo toho se vzalo akorát spoustu spoustu už známých struktur, které experimentálně byly vyřešeny a k tomu ty sekvence a prohnalo se to přes tady nějakou krásnou nevronovou síť nebo transformer a dokáže nyní predikovat v podstatě ten model, ty struktury lépe, než to dokážou ti krystalografové, ti experimentální vědci, což je jako úplně neuvěřitelný. A e před těmi dvěmi lety, kdy toto jako vyšlo ven, tak eh se řešilo, že to teda bude řešit hodně problémů a se to ai trošku přehánělo, že to bude řešit všechny problémy v biologii. Není to úplně tak, ale například potom z toho ten výsledek to, že jsme schopni nasimulovat, jak se nám bude chovat ten protein, když ho nějak oeditujeme, když v něm bude nějaká mutace, jestli bude více nebo méně patogenní, tak bez toho, aniž bysme to museli experimentálně zkoušet, tak to jako je velká síla.
A jenom k čemu to jde využít? Teoreticky vývoj léků nebo
eh vývoj léků je asi jako velmi dobrý příklad. samozřejmě základní výzkum na úrovni eh proteinu a například teda já konkrétně využívám takový derivativ toho alpafoldu, který se jmenuje Alpha Missense, který právě predikuje, jak moc nějaká mutace ovlivní strukturu toho proteinu na základě toho velkého modelu. Takže v tu chvíli já, když pak u toho pacienta v těch datech vidí člověk, ano, on má tady mutaci v nějakém genu brka 2, tak mně to řekne buď to tam, protože on může mít tu mutaci v nějakém genu a ta mutace může vadit a nebo nemusí. A tady na základě tohoto modelu jsme schopni říct, ano, tolencto je potenciálně patogenní varianta, která může způsobovat tu nemoc, co ten člověk má a nebo ne. Todlencto je binanta, která vlastně nevadí. Tak to je taková jako velká síla, kdy se to dělalo se to různými způsoby, ale tento je asi nejlepší v tuto chvíli.
Můžu jenom malou věc. Eh, zajímavostí může být, že v tom týmu Alpafold, což je docela malý tým 10 až 20 lidí, je jeden Čech, můj spolužák Skej Bridge E, Augustine Gedek se jmenuje, takže podle mě, jak jste říkal, nebo já minimálně cítím, že to je pravděpodobně něco, co se získá na balovu cenu. Jednou tady ten výsledek a je zajímavé, že eh máme také jako českou reprezentaci v tom týmu, který to postavil Jan Pes. To vlastně ještě jsou ty umělé inteligence, ne toho generativního typu. Tady pořád se snažíme spíš zjistit, jak to vypadá, než bychom z toho tolik predikovali. Ale právě ten článek, který e se zmiňoval tady na začátku, tak ten je o tom, že použili nějaký už zase novější modely toho Alpafoldu. A vrátím se zpátky k těm krisprům, což je ta technologie, která vám dokáže ustřihnout tu v tý DNA vyměnit jedno písmenko z těch našich 3 miliard. Teďka je velký halo, že bude genová terapie na eh betatalasemii a eh srbkovitou anemii. A to je opravdu jedno jediný písmenko z těch třech miliard rozbitý, víme, který. A je schválená teďka pár měsíců první eh jako léčba na toleto genetická, kdy se ty krvinky odeberou, kdy prekurzory krvinek, v nich se to opraví a pak se vrátí zpátky. tomu pacientovi. Tydlety genetický nůžky, ty jsme si půjčili od bakterií a bakterie to mají jako ochrannej mechanismus, aby tu cizí DNA, kterou někde najdou eh ve svým okolí, tak aby ji rozstříhali, aby náhodou nedostali té špionážní práce, aby nedostali cizí informaci do sebe, podle který by pak dělali něco špatnýho. Tak oni se bojej cizí informace a mají na to tyhlety nůžky, ale tyhlety nůžky jsou skvělý na takovouhle obranu, ale nejsou tak úplně dokonalý na to, na co bychom je my chtěli použít, opravit to v tom pacientovi. A ta kde je ta E teďka udělala velikou věc, uvidíme, ještě to není ani recenzovaný, vyšlo to před dvěma dny, že eh navrhla lepší ty krispry, tak jako to ty textový navrhují text a možná už třeba básničku navrhnou líp než ten autor. Třeba já kdybych napsal básničku, tak bych asi prohrál soutěž s umělou inteligencí. Tak tady ta umělá inteligence navrhla ty nůžky vhodnější k tomu štípání. Navrhla jich 50 a polovinu z nich už opravdu ti autoři teda biotechnologicky vyrobili a vyzkoušeli, že opravdu fungují líp, než to, co máme v tý přírodě. Tak to je e to je takový opravdu skok, který je nečekaný, že že dokážeme nejenom, že dokážeme pochopit ten záznam, jak je v tý přírodě, tam ještě pořád nejsme, ale doufáme, že se tam dostanem, ale dokonce i s tím nepochopením, tak už dokážeme navrhovat, jak a vylepšovat tu věc, e, než tak, jak se vyvinula za tu dlou za ten dlou í čas přírodě. Tak to je jeden z těch příkladů eh vlastně úplně novýho použití modelů, který nejsou jazykový. Je to teda ten proteinový model, ale evidentně se naučil chápat ty proteiny dobře.
Paní Plevová, mě zaujalo v tom vašem úvodním příspěvku, když jste mluvila o té diagnostice, já třeba vím z prostředí radiologů, že tam když se umělá inteligence naučí, tedy na správně okomentovaných snímcích z rentgenu, tak tam má poměrně spolehlivé výsledky. Vy jste mluvila o tom, že to je tak trochu i nepřítel, s kterým je třeba spolupracovat, ale Jak tady dnes eh vypadá to zapojení umělé inteligence do diagnostiky, tedy nádorových onemocnění v daleko větším detailu, než jsou nějaké radiologické snímky právě na té buněčné úrovni. Tak jak už se tam třeba podařilo odhalit nějaké nové vzorce, které lidské oko neumělo do té doby vidět?
Já bych se zastavila už tě u tě ještě u těch zobrazovacích metod, protože tam opravdu už ty nástroje eh které by dokázaly vlastně z obrazových materiálů, ať už z kolonoskopií nebo nebo eh z mamografu třeba, tak umí opravdu najít drobná nádorová ložiska lépe než lidské oko. A to jsou systémy, které už se v dnešní době testují. Testují se i u nás po České republice. Eh, neřeknu vám konkrétní pracoviště, abyste eh, jak ne, že bych nechtěla, ale eh vím, vím, že je prostě těch pracovišť je opravdu několik, eh, která to opravdu testují tady ty nástroje. A co se týká té buněčné úrovně nebo úrovně DNA, tak to je to kde kde eh my to využíváme tím způsobem, že když se sekvenuje lidská DNA, e, když už ten vzorek přijde a vyšetřujeme buď tu zárodečnou DNA, kterou jsme právě zdědili od rodičů a nebo tu DNA jako somatickou, to což znamená, že to je to, co se vytvořilo v našem těle v průběhu života, tak nacházíme řady variant eh genetických. Dřív se tomu říkalo mutace, teď tomu říkáme varianta, protože eh ta mutace, kole kapače se smě, ale eh
lekce covidu zapracovala.
Měl být opatrnější a opatrnější.
Tady tato terminologie se do genetiky dostala pravdu už před covidem, ale eh ten důvod je právě to, že eh varianty eh v DNA můžou mít různý význam a různý dopad. Můžou být zcela benigní, což znamená, že opravdu nezpůsobují vůbec eh žádné e změny ani třeba v Expresi RNA. Eh prostě tam můžou být a a nic nedělají nebo dělají minimum a nebo naopak jsou patogenní. A to jsou ty varianty, které mají ten dopad, e, kdy víme, že prostě to je ta ta varianta, která může vést k rozvoji třeba karcinomu prsů v případě třeba brcagenu. Ale pak je tam poměrně široká skupina eh variant, které jsou e to z angličtiny variant of unknown significance, takzvané w varianty. Eh, a furt je to, e, dejme tomu třeba 20 %, když se člověk hodně dobře snaží, jsou na to precizně zpracovaná doporučení. jakým způsobem ty varianty hodnotit. A i když ta doporučení použijete, projdete si všechna ta kritéria, která musíte hodnotit a je jich docela hodně, e, tak vám pořád zbyde spousta variant, které prostě snadno zaklasifikovat e nejdou. A člověk musí studovat literaturu, procházet e různé eh i predikční nástroje, všechno možné. A je to poměrně náročná práce eh s tím výsledkem, že člověk občas má opravdu obavu, aby vydal nějakou variantu patogenní, e, nebo naopak benigní, protože obojí, pokud je to špatně interpretované, může mít eh zásadní dopad e na ty jedince, kteří se dozví e ten výsledek.
A odpovědnost nese
odpovědnost nese ten, kdo to eh vydal, no lékař teda v našem prostředí, ale lékař se řídí informací, kterou dostane u toho molekulárního genetika z laboratoře. A eh ta AI momentálně proniká právě do toho do těch postupů té interpretace variant. A existují nástroje, některé jsou volně dostupné. Je to jako super, protože řada diagnostických laboratoří v České republice je radši, když může mít něco zadarmo, protože nemá úplně na to, aby si to zaplatili ve velkém množství. Ale existují i placené verze, do kterých nahrávat e víc variant. Má to další funkce navíc, ale tady ty nástroje výrozně nám usnadňují to, jakým způsobem ty varianty interpretovat a dělají to docela dobře.
Nadím i ještě jednu doplňující otázku se vznáší ta otázka, že E, vlastně potom pracují genetici s nějakými černými krabičkami, do kterých úplně nevidí a musí věřit v tu interpretaci na základě strojového učení. Tak kdybyste k tomu měla nějakou vaši poznámku, protože mi přišlo, že tam trochu ten nepřítel v uvozovkách, jak jste řekla, asi vězí.
Ano. Ano, přesně. Myslím si, že v tom ten nepřítel vězí. E protože eh je samozřejmě optimální, když člověk zvládá dobře eh molekulární biologii a genetiku a zároveň je skvělejm programátorem a bioinformatikem, ale rarita taková není a lidí, kteří by zvládali obojí dobře, eh velmi dobře, tak je, eh, velmi málo a většinou se prostě člověk buď přikloní na tu stranu, že dělá dobře tu práci v laboratoři a eh rozumí líp těm datům, dokáže to třeba líp zkorelovat eh s fenotypem, teda s tím, jak se to dané onemocnění projevuje a nebo že to prostě dokáže napočítat a eh zná ty čísla, zná ten příkazový řádek, ale už mu nemá kapacitu mentální na to, aby dokázal se podílet na té klinické interpretaci. Takže v tom právě si myslím, že řada biologů dobrovolně zůstává eh s tím, že pracuje s blackboxem, eh protože prostě ne nemá kapacitu na to, aby to pojala.
Jan Pačes.
No, tady jsme narazili na zajímavý problém, protože žijeme v dobré době v tom slova smyslu, že máme ještě ty odborníky, jo. Tak dneska už víme, že ty AI třeba dokáží lépe klasifikovat nějaký fot geografie nebo nebo histologické nálezy, protože jich prostě viděla víc a to ale pořád ještě zatím musí být doktor, který převezme tu zodpovědnost a řekne, je to tak. A ten doktor tomu ještě těm obrázkům rozumí, protože to taky dělal celej život.
Ale za pár let už tydlety doktory mít nebudeme, protože kdo by dneska se učil pořádně rozumět histologickým obrázkům, když je jasný, že to dělá líp a já bych byl jenom ocásek, kterej teda, ale na kterým pak bude ta zodpovědnost. Takže to je něco, co bude obrovská změna, kterou budeme muset nějak vyřešit jako lidstvo, předat tu důvěru, teda delegovat důvěru, protože jak jsme se dozvěděli, ale já si taky myslím, že tak bude, že ta AI bude za chvilku dělat ty věci lépe.
Já na to zareaguju tak, že právě možná z toho eh vzniká ta obava řady lidí, že eh AI převezme naši práci. Eh možná některých z nás ano, eh bohužel to tak asi bude. Eh zároveň stále e doufám, že tím to otevře prostor eh pro to, abychom mohli dělat něco jiného, lepšího třeba a Ale ale třeba co se týká hodnocení těch genetických variant, tak tam eh stále platí, že je preferováno, aby se to vyhodnocovalo nejméně dvěma nástroji, protože jak jsem říkala, sice ty nástroje to v současné době ty vypočetní nástroje to dělají relativně dobře, ale eh stále je tam potřeba eh to kontrolovat eh protože nestává se výjimečně eh že by eh jeden na eh ten software vyhodil jeden výsledek. Varianta patogenní a druhý software vyhodnotí, že je benigní. Může se to stát. A pak právě tam pořád je potřeba toho člověka, který s tou interpretací má zkušeností, který opravdu musí tu interpretaci ještě dotáhnout a ještě stále v této oblasti je potřeba ten lidský prvek, jo, že bez toho to prostě nejde.
Stan za Ford.
Mně přijde, že ten argument s tím, že ten lidský expert dnes pořád umí ty histologické věci analyzovat a ale že v budoucnosti nebude, protože ty nástroje budou lepší než on nebo ona, mi přijde potenciálně nepravdivý. v tom, že já jsem byl celý život o hodně horší než kalkulačka v dělání aritmetiky, v počítání věcí a neměl jsem nikdy ani šanci být podobně dobrý nebo jako digitální počítač. A i přesto jsem se naučil, jak se dělá násobení eh velkých čísel vedle sebe a tak. Takže bych řekl, že jakoby ta pedagogická praxe toho, jak se člověk vyvine od těch jednodušších úkolů až k těm komplikovanějším a ta reálná ta ta hranice toho, co dokážeme dělat co nejefektivněji a nejrychleji. Možná spolu ne nutně soutěží, že já pořád se učím matematiku od píky i přesto, že už asi od bebit od mechanických počítačů 200 let zpátky jsme to dokázali dělat rychleji a levněji a efektivněji.
A zároveň taky abych trochu pšoval zpátky na ten blackbox argument, mně přijde, že ty black boxy používáme skor všude, že já když mám jako hypotetický biologový mikroskop nebo něco takového, také nevím, jak přesně e vím zhruba, jak funguje. Podobně jako vím, jak zhruba funguje eh ta neuronová síť, ale nevím přesně, jak jako upravuje obraz nebo odstraňuje šum nebo jak přesně ta čočka magnetická ověř funguje a tak. A zdá se mi, že hodně vědců dnes už e e, závisí na hodně blackbox nástrojích, které používají v astronomii třeba, ve které jsem chvíli pracoval na začátku mého doktorátu, se používají obrovské simulace k tomu, abychom nasimulovali vývoj vesmíru s různými počátečními podmínkami. A my sice rozumíme těm zákonům, které do toho vstupují na začátku, ale pak provedeme miliardu kroků mezi těmi zákony a tím výstupem, tím, že třeba vidíme spirální galaxii, která se objeví v té simulaci.
A eh podle mě tady to naráží na zajímavé aspekty toho, co jako znamená pochopení nebo co je filozoficky to, co bychom chtěli mít, protože Třeba v té fyzice chápeme, že to pochopení je docela hluboké a fundamentální a i přesto ty důsledky těch zákonů, které chápeme, třeba Newtonových zákonů a které třeba vidíme na obloze spirální galaxie například, nejsou úplně přesně odvoditelné z těch zákonů samotných a potřebujeme těch miliardu kroků simulace mezi těmi zákony a tím důsledkem. Takže podle mě pochopení nebo nějaká interpretovatelnost přichází v různých formách a jeden z těch aspektů je, kolik kroků musím provést mezi tím fundamentálním zákonem, tím popisem a tím důsledkem. A čím víc kroků mezi tím, tím méně př U je to propojené. Já třeba, když vidím kivadlo, tak chápu, proč se kyvlo kýve tak, jak se kýve na základě newtonových zákonů.
Ale třeba ty spirální galaxie na obloze, to, že jsou přímým důsledkem Newtonových zákonů, jsme nevěděli až do asi 20 let zpátky, protože jsme prvně v simulaci dokázali vidět spirální galaxii. Nebylo to něco, co jsme nečekali. Ten prior byl hodně vysoký, ale závisleli jsme na black boxu, který nám to ukázal, že tohleto přesně je ta konsekvence těch fundamentálních zákonů. Takže mi přijde, že vůbec ten důraz na to pochopení tedy je dobrý a jako vědec s tím hodně sympatizuji, ale Asi jsem eh během posledních pár let ztratil ten důraz na to, že to pochopení je to fundamentální, to, co potřebuji, že to, co často chci, jsou predikce. A pokud to pochopení vede k dobrým predikcím, tak je to skvělé.
Ale pokud k těm predikcím vede nějaký blackbox model, který očividně dělá něco ověřitelně správně, třeba ten alpha fold, jak jste zmiňovali, že je prakticky použitelný, tak ne nutně si řeknu, je to asi horší, radši bych to pochopil, ale myslím si, že je reálně možné, že hodně zajímavých důležitých systémů ve světě nemá něco, co vypadá jako pochopení, které je natolik kom kompaktní, abych ho chápal jako pochopení, ale zároveň toolik prediktivní, aby mi stálo za to. Myslím si, že je možné, že to pochopení může být obrovské. Je to plná kniha zákonů a to trochu predikuje to, jak se třeba chovají proteiny, ale není to něco, co by můj mozek vnímal jako nějaké krystalické pochopení toho, jak ten systém funguje. A jak teďka zmenšuji tu velikost toho pochopení nebo toho toho popisu, tak ztrácím tu prediktivní sílu.
E, to pochopení je čím dál tím méně důležité a myslím si, že potenciálně neexistuje ten sweet spot, kde je to natolik malé, aby to pasovalo do mého mozku a a bylo to pro mě pochopením a zároveň natolik prediktivní, aby to stálo za to, že možná Newtonovy zákony a fyzika jsou špatný příklad, že možná tom jsme měli štěstí s tím, že eh jsme našli něco tak kompaktního a tak prediktivního jako ty Newtonovy zákony, Einsteinov ravnice a tak.
Vojtěch Bystrý. Ano,
já vlastně souhlasím a jako, že bych se nebál úplně blackboxů. Na druhou stranu, v rámci klinických predikcí si myslím, že to bude naprosto zásadní věc pro to, aby to bylo uplatitelné v praxi. Protože tam, když si představíte, že kdybyste měli model, který bude z 95 % predikovat správnou diagnózu a jen z 5 % se mílit. A věděli, že ten doktor jenom z 80 % predikuje správnou diagnózu a z 20 % se mýlí, tak pořád těch 5 % toho modelu, který akorát nasypete data a on vám řekne něco a vy na základě toho budete toho člověka operovat, tak už jen legislativně je to strašný problém, protože tam není ten, kdo má tu zodpovědnost vlastně a tam jediný způsob, si myslím, že je mít nějakou způsob vysvětlitelnosti toho modelu. aby se řeklo, on na to došel proto a proto. Ten doktor to může říct. Ano, to s tím souhlasím, s tím postupem a vlastně vlastně to tak říct.
Můžem maličký komentář? Mně to přijde analogické, jak k samořídícím autům. Je to tak,
to je podobný problém. Ale reálně já třeba samořídící auta používám minimálně každý týden v San Francisku. Zavolám si je na aplikaci, jako kdyby to byl Uber nebo Bolt nebo nějaká nějaká věc. Ono přijede bez rigiče, já nastoupím, odveze mě do cíle, vystoupím stejně jako kdyby to byl řegič. Je to na 100 % black box. Já nemám tušení, jak to auto funguje. eh používá hodně neuronových sítí, které interpretují obraz e signál z leaderů z lasového měřáku vzdálenostti, který se točí nahoře a míří, jak daleko věci jsou i po tmě. Takže zdá se mi, že je to hodně ekvivalentní tomu případu v medicíně. Je tam také právní zodpovědnost za třeba potenciální nehodu. Takže tohleto je minimálně jako cesta, kde záleží na hodně malé chybovosti. Je tam právní zodpovědnost a i přesto se to dělá a rozvíjí.
Právní zodpovědnost za tu nehodu má kdo?
Nemám tušení, ale minimálně prak ale minimálně prakticky se teďka dělá, testuje, takže To asi nemůže být natolik velký problém v té cestě, aby to zastavilo ten vývoj. Takže to, že se jako v ulicích mezi ostatními auty používají, ukazuje, že to není nepřekonatelný nějaký roadblock nebo překážka.
Já jsem chtěla opravdu velmi velmi stručně reagovat se omlouvám. Eh, ve zdravotnictví jednoznačně zodpovědnost vždycky nese ošetřující personál. Tam se nemůže vymlouvat doteď,
ale ale nemůže se vymlouvat na blackbox a prostě je to je to, že jo, ten lidský faktor bude pořád v nejbližších letech e ten klíčový.
Já bych to chtěl trošku, tole je určitě důležitá otázka, ale chtěl bych to trošku posunout eh zpět k praxi. A sice pan Ford nám před tou přednáškou říkal, že ty velké systémy umělé inteligence jsou vlastně už na úrovni mozku, velkých savců, řekněme Ježška, že ježek, ale má spoustu, řekněme, balastů, který ho ta evoluce tak vymodelovala, aby jako přežil, zatímco ta umělá inteligence tohle nepotřebuje. E zároveň slyšíme, že to je trošku black box. Pan Ford se právě věnuje tomu, aby pochopil, jak to vůbec funguje. A teď tady máme tu praktickou stránku. Tak kde čekáte vy jako experti, že dojde třeba k nějakému průlomu? Bude to právě třeba v oblasti navrhování těch léků, nebude to třeba v konstrukci biologických zbraní, když slyšíme, že umíme podle eh sekvence už poznat trojrozměrnou strukturu proteinu. Eh, kde tedy čekáte, že nás to posune dál?
Jan Pačes.
Ano. Je. Je potřeba rozlišovat ty hlasy a pardon,
já si myslím, že to nejdůležitější, co nás čeká, že není potřeba z toho mít strach, že by ty umělý inteligence dokázali navrhnout něco obzvlášť vošklivýho, jako biozbrání. To umíme i bez toho, jo. Takže to na to nepotřebujeme žádnou umělovou inteligenci. A ta příroda toho vyrobila tolik, že i když se poučíme od ní, tak můžeme napáchat škody velký. Ale to, co mně připadá, že bude hrozně významné a o čem možná by bude i zajímavá diskuze, je, že Když se dělají ty jazykové modely na jazyku, na tom, tak tam je opravdu ta přirozená velikost toho tokenu. Je to to slovo, tak jak vznikly. A u tý DNA to nevíme. Tak na úrovni proteinů to jsou třeba tři písmenka, ale možná, že v té DNA je uložená ta informace jako vícevrstevně jako ty dlouhé interakce, jak se navzájem ovlivňují, což třeba v tom jazyku tolik není. A že tam by mohl přijít nějaký hrozně zajímavý průlom, že najednou nám ty to obrovský množství dat, který my v tý biologii taky máme, jak se ty buňky chovají. Dneska už ty technologie umožní číst genetickou informaci jedné jediné buňky. I to, který geny jsou tam zapnutý, jak se ta buňka mění, to jako něco, co před pár lety si člověk vůbec nedovedl představit. Těch dat je hodně, ale pořád skládáme. Je to spíš taky jako když máte ty puzzle a teďka z těch malejch kousků to skládáte, ale pořád ještě nevidíte ten celkový obraz. A tam si myslím, že to bude, že najednou najednou teda přijde někdo, možná nebudem chápat, jak on to vidí ten celkovej obraz, ale že se zjistí, že tam ten celkovej obraz opravdu je. že neskládáme jenom nesmyslný šum a že to všechno zapadne do sebe a dá se tam takhle ten, znáte ten pocit, ten poslední kousek takhle do toho obrázku, jo? Tak e na to se moc těším a to je na dohled teda, si myslím,
co to bude znamenat, jako co v tu chvíli pochopíme
pořád ještě tu biologii my jako vědci taháme e jako za za krátkou část toho provázku. Prostě neumím, ne nerozumíme ty biologii, nedokážeme napredikovat, neumíme léos vyléčit, nevíme, proč se něco děje tak, jak se děje. A To si myslím, že prostě tenhleten systém začne fungovat. Já nevím, třeba z toho budeme mít model takový buňky v počítači, kde to bude muset mct všechno otestovat a nebudeme muset na pacientech zkoušet, jestli tahle chemikálie to změní nebo ne, protože to dáme do toho modelu a on nám to rovnou řekne, že to změní nebo ne. Takhle takhle si myslím, že to to bude ta změna velká pro medicínu, ale hlavně si myslím, že to bude ta medicína bude opatrná. To je pořád je to přesně tak. Je za to zodpověd a s tím na to zdraví, na sebe sama jsme cit Ale biotechnologie. Dokážeme třeba nechat vyrábět bakterie nebo kvasinky, nějaký plasty eh na požádání. Jo, ještě v souvislosti s 3D tiskem to úplně si dovedu představit, že budeme umět dělat takovýhle věci.
Já t můžu jako s tím bych souhlasil na na té úrovni těch biotechnologií, protože tam se bavíme zas taky je buňka a buňka, jo, buňka bakteriální, která ještě je jenom taková, že vlastně je navržená na to, aby třeba chroustala plasty nebo něco metabolizovala. To si asi dokážu představit, že by se nasimulovat dalo. A v tu chvíli opravdu, kdyby byla simulace procesů všech v té buňce, tak je to úplně jako neuvěřitelný a pomohlo by to i v těch smyslech. Kdyby byla ta stejná simulace na úrovni eh eukariotických buněk jako těch lidských a ta ještě nedejbože s nějakým mikroprostředím, tak to by bylo jako úplná bomba, protože to by se fakt dalo léčit skoro od počítače. Ale tam teda nevěřím, že tam jsme jako moc blízko ještě, protože pořád v tuto chvíli všechny tady ty klinický věci, co jsme se bavili, DNA, ta Tak tak my nevíme mechanisticky, jak to funguje. Občas trošku, ale 99 % bych řekl veškerých tady těch klinických dopadů je na statistické úrovni, že my víme, že když je nějaká změna, tak potom ti lidi s větší pravděpodobností jsou nemocní. Když je jiná změna, tak oni nejsou nemocní. Když mají tuto změnu, tak mají modrý vlasy. Ale nevíme proč. My nevíme, jak to tam funguje. Jo, já jsem řeknu modrý, že to zase asi ne, ale modrý oči jsem chtěl říct a nebo černý vlasy, ale to nevadí. Eh, tak že nevíme proč, jo. Je to všechno jenom statistika a kdyby se tam doplnil tady právě nějakým tím modelem to proč, jak vlastně to mechanisticky funguje, tak to to by jako byl úplně neuvěřitelný posun. Ale já teda jsem trošku skeptik v tom, že si nemyslím, že by to bylo v řádu eh řekněme let než.
No, protože si myslím, že ta úvaha není úplně správná v tom slova smyslu, že ta DNA tam není úplně přesně zapsáno, jak ten člověk má vypadat. Ano, je tam zapsáno, že budu mít pět prstů, ale to, jak přesně vypadáme, to je interakce tý DNA s prostředím a to je pokaždiný, protože ta ta jist Co ta tam není? Nemůžeme říct. Tak tydlety čtyři písmenka vždycky způsoběj, že mi vypadne tenhleten vl, protože záleží na tom, jestli fouká vítr nebo padají kyselý deště nebo já nevím co všechno ještě. Takže to není takový návod jako návod na budovu. To je spíš návod na to, jak reagovat na prostředí a prostředí mohou být různá, ale v tom by ty AI modely jako Blackbox mohly být výborný, protože tam by to možná bylo všechno obsažený. My bychom jistě mechanisticky nevysvětlili, jak to je, ale mohli bysme tam šťouchnout a vypadnul by z toho správnej výsledek.
Říkám, Pačes, když vás teď poslouchám a teď myslím všechny, ale hlavně teď co bylo spadlo i ve vztahu k tomu prostředí a k tomu, že ty jazykové modely eh pro ty ten jazyk DNA je v něčem nepochopitelný i s ohledem na ten odpad a tak. Tak a ve světle toho e článku nebo toho propojení Chris Prus umělou inteligencí, řekli byste, že vlastně možná vstupujeme do nějaké nové evoluční fáze právě pod tlakem umělé inteligence, která dokáže rozkrývat ty eh řády, které jsme dosud neviděli a nějak nově působit skrze i genetiku. Vím, že to je jako trošku big picture a asi jsme ještě daleko, ale
na tuhle odpověď se nehlásí někdo jinej.
Trochu mi tam ty puzle vyvstávají. Jo, možná ten obraz je jiný. Stanislav Ford.
Mně přijde, že jsme do nové evoluční fáze e v podstatě vstoupili s tím, že vývoj světa, organického života, přestal být závislý jen na evoluci, ale začal být kulturně podmíněn. Přijde mi, že jako v té nové fázi jsme posledních pár tisíc let, co stavíme civilizaci. To byl ten hlavní zlom, když se podívám na ten big picture, že jo. Tak e miliony let jsme byli opice, který neměli žádnej vliv na prostředí. Měli jsme malej počet jedinců na hranici vymřední skoro neustále a pár tisíc let potom, což je z tý škály milionů let, eh, v podstatě takeof jako singulární, že z ničeho na nic eh máme schopnost ovlivňovat ostatní život. V podstatě kdybychom chtěli, tak vyhladit celý druhy, což není jako pozitivní věc, ale ukazuje to, jak moc velkej vliv máme na svět. Měli jsme eh zástupce našeho druhu, který chodili po povrchu měsíce a pravděpodobně jsme postavili něco, co je podobně chytrý jako my a bude ještě chytřejší. Takže Z pohledu toho dlouhýho časovýho horizontu si myslím, že ten hlavní zlom byl, když jsme začali akumulovat kulturní a civilizační znalosti, ne skrze evoluci, ale skrze extrémně hloupej, nepředvídatelnej proces toho zkoušení různejch variant, kterej nemá žádnej jakoby foresight v tom, že on ten evoluční proces, pokud to chápu správně, je extrémně dobrej tvůrce života, e, protože má hodně příležitostí zkusit různ varianty, ale nemá skoro žádnou schopnost vidět dopředu, což je docela velkej rozdíl s tím, jak navrhujeme inteligenci dneska v počítačích, protože mě po takzvanej gradient desense, takže ten systém jakoby vidí trochu dopředu, kterým směrem by se měl trochu upravit, aby se zlepšil. Evoluce tady ty věci musí zkoušet úplně náhodně a ty prostory, ve ktereých se tady ta náhodná explorace provádí, jsou extrémně vysokozměrný, což znamená, že ten proces evoluce je hodně neefektivní v tom sochařit život z neživota. Na druhou stranu náš způsob je o hodně rychlejší, náš jako lidskej ve tvorbě inteligencí umělejch. Takže já mám vlastně jako dva body. První je, že podle mě ten zlom nastal s tím, že jsme eh před 10 až 100 000 lety začali být lidská civilizace. a začali jsme akumulovat kulturní eh znalosti a přestali jsme bejt podmíněný evolucí. Mohli jsme trochu vyvstat z toho diktátu evoluce. Eh a druhej bod je, že jsme v nějakým slova smyslu trochu porazili nebo zlepšili ten evoluční mechanismus v tvorbě potenciálně v uvozovkách novýho druhu, novýho inteligentního druhu, protože ten mechanismus, kterej používáme, je o hodně výkonnější a schopnější e odhodu dopředu. Takže to jsou podle mě ty dva body, který v tom vidím z toho vysokýho pohledu
o těch bystrý.
Jestli můžu reagovat, tak Zaprvé naprosto souhlasím s tím, že jako evoluce pro nás jako lidi, otázka, který je ten přesně časový bod, ale se naprosto změnila v momentě, kdy jsme začali zaznamenávat svoje myšlenky. A vlastně v tuto chvíli ta biologická evoluce je naprosto pořád na na nějaké úrovni, zatímco ta naše kolektivní inteligence vlastně a kolektivní evoluce vystřelila až do vesmíru. A druhá teda pak další ten bod je teďka teda dneska s tím, jestli začneme už aj vlastně zpětně měnit teda e ten kód TDNA, což otázka, jestli budeme, děláme to u rostlin, což asi je v pořádku. Otázka, jestli se to bude dít u živočichů, eh to to jako je velká a jestli to můžeme, jestli je to vlastně správně nebo ne, to je tak asi velká filozofická otázka. Ale ještě bych chtěl k té myšlence těch sítí vlastně, že že jsme vytvořili něco něco inteligentnějšího nebo nový druh. Já já si furt jako, že to mám pocit, že to už je trošku posun mezi e, biologickým životem, který je nějak jako definován a potom vlastně to to, o čem jste mluvil, bych řekl, že je vlastně akorát jako kdyby revers entropie, že vlastně jako kdyby děláme eh systém z chaosu, jo, a že tady jsme možná vytvořili něco, co bude schopno to dělat samo o sobě do budoucna, což je taky jako zajímavý, jo, a možná, že toto bude teda jako za milion let vlastně ten zlomovej bod, kdy řekneme, aha, tady se něco odrazilo úplně novýho, co co doteďka nebylo, ale to to To uvidíme až za milion let.
Už ten malý bod. Já si nějak obecně myslím, že nějak fundamentálně nejspíš život e a všecky ostatní tyhlety věci pravděpodobně nejsou přímo závislé na tom substrátu, na kterém běží a že jde spíše než o nějaké jako na konkrétní e realizaci závislé věci, o konkrétní o nějaký jako specifický vzorec výpočtu, který probíhá. A to médium, na kterém probíhá, může být biologické, syntetické, křebíkové. Takže jako já nějak filozoficky asi nevidím úplně jakoby tu diskontinuitu. Chápu, že ten biologický život je úplně jiný, ale fundamentálně si myslím, že jde o nějaký jako vzorec výpočtu, který byl realizován v nějakém médiu, který které bylo k dispozici přírodě, protože neměla ocel, neměla polovodiče, eh neměla různé podobné materiály, ale nevidím úplně potenciálně fundamentální rozdíl mezi těmi věcmi, nejsem si na 100 % jistý, ale tak nějak cítím, že nevidím jako tu diskontinuitu mezi nimi.
To je vynikající úvaha. Jenom bych k tomu dodal, že být živý znamená mimo jiné, že je ten ten ta živá entita je o ohraničená v prostoru a v čase. Abyste mohli být živí, tak se musíte narodit a taky musíte umřít. Eh, až uděláme tydlety a je, tak možná, že ten konec tam není a pak je otázka, jestli to z definice bude ještě živý.
To bych možná měl otázku na kolegy biologii, jako musíme umřít, jako jak podstatná věc v definici života to je? Protože
vím, že to je velká otázka i v Silicon Valley a výzkum nesmrtelnosti a ale v biologii taky koneckonců.
Děláme všichni vědy o životě, ale ve skutečnosti nikdo neví, jak ten život nadefinovat. byl hrozně zajímavej. Bylo, když poletíme na Mars, tak toho jsem se účastnil někdy v roce 97, tak samozřejmě, že byla velká otázka, byl na Marsu život a teď se a jak ho poznat? Přiletíme tam, on to nebude ten náš život. Jak jak vymyslet stroj nebo něco, aby až přiletí na Mars, poznalo, že tam je něco živýho? A to byl problém, kterej vlastně nebyl nikdy pořádně vyřešen. Jak my poznáme, že něco žije? Tady si to tak můžeme mezi sebou říct, ale když potom půjdeme i v tom životě, který známe, na ty nižší hranice, tak pak máme různý parazity, pak máme nitrobuněčný parazity, který už ani samy nemůžou žít, pak máme viry, ty už asi nejsou živý. Ta hranice toho života je teda poměrně taková fazy, ne? Málokdo to umí říct. A poznat cizí život, který by byl jiný, než jaký známe tady, nevíme, jestli může být. To je teda těžká otázka a na to asi tady neodpovíme. Ale moc dobře se o tom přemýšlí.
Vy jste to právě uvrhli do takové těžké filozofické debaty, mně připadá. Jo. Ale s tím, co je živé a neživé, já si myslím, že pořád jako celkově to stvoření kolem nás nejsme jenom my lidé, furt jsou to rostliny živočichové, jste to zmiňoval, různé mikroorganismy třeba a tak. A eh toto zase já to třeba považuju za prostě přirozenou součást života. A zase si nemůžeme říkat, že přesto, že máme všechny super moderní technologie, které nám život jenom zlepší, takže prostě člověk přestává být člověkem. A s tím křemíkem je právě třeba z bod tu singularity, o kterém se mluví, mám docela obavu, že ta AI převezme vlastně tu vládu nad světem, nad lidmi a nad čím, co je tady.
Nebo nám třeba umožní opustit to biologický tělo a přesunout se do toho výpočetního.
A budeme pak třeba cítit, jo, bude jako jakým způsobem, když budeme uvažovat, tak
to se uvidí, jak nám to navrhnou, že jo. Když když nám navrhne, když nám navrhne dobrou počítačovou síť, tak budeme neuronou, tak budeme asi ji cítit.
Jo, mám hodně fundamentální a velký nejistoty kolem toho, v čem spočívá to, že já prožívám sebe tak, jako se prožívám. Takže bych určitě nevstoupil do simulace tím, že bych se nechal rozsekat a naskenovat. E, eh, takže já obecně bych nic takovýho nedělal. E, ale filozoficky mi to přijde jako zajímavá otázka, ale nějak intuitivně mám pocit, že bych nerad vstoupil do simulace tím, že mi někdo rozřežuje mozek na nanometrový čárky a nějak naskenuje a bude ho simulovat. Takže minimálně tak jako na tý bazální úrovni mám trochu to obavy z tohodle toho taky. Na druhou stranu jako nevidím fundamentální rozdíl mezi mezi těma věcma, ale i tak se bojím, že přijdu jako o to, co jsem já tím, že bych třeba vstoupil do nějakýho teleportu nebo do nějaký simulace.
Já jsem si teda upřímně řečeno představila, jak tady za třeba nějakých 300 let eh tady takovýmhle způsobem filozofují nějací roboti. Baví se o tom, co ti lidé jako ten historickej druh těch tvořitel.
No, to bude i byla tady velmi zajímavá otázka, co teda si myslíme, že by ta Eh mohla přinést jako to fundamentální zvěnu. Tak říkali jsme jedna možnost by byla, že opravdu to bude sice blackbox, nebudeme vidět, jak to pochopila, ale porozumí tomu životu. No a druhá věc je, že bude generativní, že třeba dokáže navrhnout něco živého, co nemělo předka zatím to se nám ještě pořád nepovedlo a bude to nejlepší z těch životů. Bude prostě výrazně, ne? Otázka je, co je nejlepší, ale jasně, jasně, ale to jsme zase u tý filozofie, my se z ní dneska nevyhrabem, ale že si dovedu představit, že bude schopná právě Protože to nemusí dělat metodou pokusu a omylu třeba navrhnout minimálně u těch kispův vidíme, že je dokáže navrhnout líp, než tak, jak je najdem v přírodě. A to je jenom jeden protein, ale možná, že navrhneme buňku, která bude kvasinku, která bude dělat takový pivo.
Tole si myslím, že je docela realita, jako ne, že to pivo teda možná taky, ale jako jo, Krisper a nebo
já bych chtěl kvasinku, kdy člověk ráno eh si vemme flašku s cukrem, nasype to tam do toho, v polne má pivo, k večeru už to bude víno třeba. No jo, no.
A kvasene se nikdo ne ptá tam to nevadí.
Mně vyvstává u toho otázka, jestli je dobře, že vždycky ta AI to udělá tím správným směrem, jo. Jestli ta evoluce, to, že jako postupuje pozitivně, eh něco ne jako nám neubírá, jo, protože si myslím, že je dobře nacházet i ty slepé uličky nebo jako v souvislosti s genetikou mě jako napadá, že i náš život obohacuje to, že některé věci prostě se nepodaří úplně optimálně. Jo, že že si myslím, že prostě i to i to negativní, co vlastně jako lidstvo prožíváme v řadě ohledech, ty negativní pokusy, tak jsou vlastně hrozně přínosné, ale zase beru to z toho lidského hlediska. Chápu, že možná AI to nezajímá, protože ta prostě chce postupovat dál a dál a vytvářet lepší a lepší kvality, ale pro lidský život si myslím, že to je velká hodnota.
Bychnou okomentoval, že tý evoluci to jde pořád dobře. Nejde. Ve většině případů se to nepovede. My vidíme to, co se zrovna povedlo, ale ve většině případů se to povede.
To je ten odpad, který zůstává pak někde,
ale ten odpad nám taky na něco pak je.
Stanislav Orti.
Já bych možná udělal konceptuální rozlišení toho, že ta AI není v žádném způsobu slova perfektní. Ona není eh ta metafora pro ten strojovou tu strojovou preciznost a tu slepou to následování nějakýho cíle. Eh to je hodně špatná metafora pro to, jak funguje AI dneska. Historicky to byla nějaká konceptualizace toho, jak budou fungovat počítače, když budou inteligentní, protože si lidi představili tu přesnou výpočetní sílu počítače. Ale dnešní jazykový modely jsou extrémně dobrý v tom, chápat, co třeba člověk implicitně myslí. Řekněme historicky byla taková metaforovej jako příběh, kterým taková intuiční pumpa. Eh, tak říkajíc. Lidé říkali, až budeme mít AI, tak to bude super. Budou třeba ty roboti hodně chytrý, ale my jim pak třeba řekneme, ať přinese kafe ten robot a ale už mu neřekneme jako nerozbij vázu cestou a nešlápni na dítě a nekopni kočku a takhle. A ten robot nějak nominálně splní ten cíl, přinese to kafe, ale protože jsme explicitně neřekli: "Neudělej to a neudělej to a neudělej tamhleto a ten robot nějak jako v tý metafoře nechápe, co lidi myslí implicitně, tak to zkazí. z toho lidskýho pohledu, ale dnešní jazyk výmr vůbec nejsou takovýhle. Oni úplně přesně chápou, co implicitně myslíme, když řekneme přines kafe nebo udělají něco. Oni jsou v nějakým smyslu o hodně lepší v chápání implicitního významu emocí a lidských nějakých intencí, než v tý precizní logický matematice. A v tom, co si představujeme, že počítač reálně dělá. Od někoho sice běží na počítači jako substrátu a jsou to emulace hodně difuznějších, metaforičtějších, intuitivnějších systémů. Takže to je možná zajímavá věc. S tím nedávno bohužel zemřel profesor Kaneman, který napsal tu knihu e, myšlení rychlé a pomalé a tam je zajímavá kapitola s experimentem s pálkou a míčkem. A to je taková jako úloha, že lidem řekneme, že míček a pálka dohromady stojí dolar 10, pálka je o dolar dražší než míček. Kolik stojí míček? Ligi typicky řeknou 0,1 dolarů, protože intuitivně odhadnou, že se ty čísla nějak odečtou. A když řeknete řeknete jazykovému modelu rychle mi odpovězt na tady tu otázku, tak první, co vyplivne, je tady ta špatná, logicky eh špatná odpověď, která ale intuitivně dává smysl. Když mu pak řekneme, přemýšlej nad tím déle a může si to rozmyslet v několika tokenech výstupů a až pak odpoví, tak podobně jako člověk s tím větším eh rozmyslem odpoví správně. Takže nějaké lidi to relativně donedávna nečekali, ale to chování těch umělých inteligencí, které jsou, které jsou dnes nejsilnější, které jsou postavené na jazykových modelech, v nějakém eh slova smyslu zdědily lidské logické chyby, které byly právě reprezentovány v těch datech nebo v těch jako typech přemýšlení a chovají se v něčem podobně i logicky eh jako lidi. Takže jenom jsem chtěl trochu korigovat tu logickou metaforu toho stroje. On se nesnaží nějak myopicky optimalizovat jeden cíl, ale v něčem je podobně nepřesný a podobně intuitivní jako člověk,
protože ho trénujeme na našich nepřesných výstupech.
Je to možné, ale není to jisté.
Tak možná až ty umělá inteligence, co vytvoří umělá inteligence,
to už dneska relativně používáme. Třeba já jsem spolautorem článku, který se jmenuje Constitutional AI, eh, kde necháváme dvě inteligence, aby se spolu bavili a eh vzájemně si kritizují výstupy na základě nějakého popisu, principů, které po nich chceme, třeba ať se chovají férově, ať nediskriminují a tak. A oni odpovídají a kritizují si výstupy a vzájemně si je revidují a pak na nich zároveň trénují a vytvoříme v podstatě takový jakoby takovou spirálu, která vede obě ty inteligence k lepšímu výkonu. Takže už dnes používáme výstupy umělejch inteligencí k tréninku, umělejch inteligencí.
Takhle se nacvičil ten ta umělá inteligence, co vyhrála GO, že jo, to hrála spolu se sebou.
Pě tak. Mm. Bez toho, aby kdykoliv vydělal lidskou hru. To tady pan profesor mluví o systému Alpha Zero, který vyhrál v extrémně těžké diskové hře jmen Go. Je o tom dokument na YouTubu extrémně dobrej. Deep Mind Alpha Go. Podívejte se, je to hodně je to dělan ve stylu sportovního dokumentu o nějakém velkém vítězství, ale ten systém nikdy neviděl libovolnou hru. E, ten původní ano, ale ten budoucí už ne. E, libovolnou hru, kterou by hrál člověk a jenom z pravidel a z hraní sám proti sobě se zvýšil na úroveň, která byla natolik vysoká, že jsme nebyli schopni měřit, jak dobrý v té hře reálně je. Takže z hry, která byla neporažená dlouhou dobu, nečekalo se, že další dekády bude poražena pomocí tradičních přístupů ve strojovém učení, jsme měli něco, co během 8 hodin tréninku, si myslím, přesáhlo světové velmi v úrovni a pak jsme nedokázali úplně přesně měřit, jak dobrý ten systém reálně je, protože jsme neměli žádný benchmark proti tomu. Ale všechny tady ty historické znalosti, ta hra je 1000 let stará, které jsme čerpali jako civilizace, ten systém znovu objevil během několika hodin výpočtů.
To je fascinující eh fascinující vyhledy do toho, jak to funguje, ale musíme dát také prostor našemu publiku, aby nám pokládalo otázky. Takže
první dotaz.
Mě by třeba zajímal váš vhled do eh věci etiky umělých inteligencí, protože samozřejmě u Open AI, u chat GBT Mid Journey, Dí se hodně řeší, na čem se ty modely trénovaly, že bez souhlasu autorů, ať už textu nebo obrázku nebo obrazového materiálu, vzali věci z internetu s myšlenkou, co je na internetu, to je všech a na tom se vytrénovali. A teďka se zpětně ozývají různí autoři, ať už textů nebo například obrazů, s tím, že nedali k tomu souhlas a nechtěli, aby se na jejich tvorbě modely neuronové sítě trénovaly. Jak se tohleto třeba řeší ve vědě? Ptáte se nějak těch lidí, jejich sceny? ať už e mozku nebo jejž DNA máte, jestli ho můžete případně použít k trénování těch modelů nebo se tohleto vůbec neřeší a je to ve jménu vědy. Jednou to bylo posketnuto, je to anonymizováno nebo
todle je mimořádně velký problém. Tak hodně záleží na státu. Jsou státy, kde je to přísné. Tady v Evropě zrovna my jsme na tom hodně přísném konci eh a kontroly a to se smí a co se nesmí, ale je to nevyřešená věc. Nevíme to. Pacient musí dávat informovaný souhlas, ale ono ta techn ie se vyvíjí tak rychle, že k čemu má dát souhlas, když ještě ani neví, k čemu to bude použité. To je je problém toho, že to se i u těch jazykových modelů zjistilo, že při správně zadaných promptech, přestože on si nepamatuje to konkrétní dílo, nemá tam někde uložený knížku, ale dokážete ho donutit, aby ji vlastně zreprodukoval z těch eh z těch nebo její části, že se pozná, že byla součástí toho. No, tak až se tole bude dít s pacienty, tak to samozřejmě bude taky problém a Příně řečeno, nikdo neví, jak to řešit, protože je tam moc úrovní, tak my už vůbec ani nerozumíme tomu, jak oni ty modely dělají. A když to pak ještě, představte si, že přejdete do parlamentu a tam budete říkat, že by se na to měl udělat zákon. Takže nevíme a je to opravdu problém, protože ta technologie jde podstatně rychleji než naše úvahy a než naše schopnost se prostě rozhodovat. No,
já k tomu ještě dodám, že mě k tomu hned napadlo takové to, že Amerika inovuje, Evropa reguluje, platí to na evropské úrovni úplně jako 100%. Eh, a je to i důvod, proč řada nebo vůbec AI, proč vznikla v Americe a proč vlastně se rozvíjí v Americe daleko víc než v Evropě. Protože třeba co se týká velkých genomických projektů, e, tak v Americe se to rozvíjí jako daleko rychleji právě díky tomu, že ta etika je míň regulovaná v Evropě. Nevím vlastně, jak moc to proniká mezi eh veřejnost, že existuje iniciativa milion evropských genomů a je to iniciativa, v níž se evropská nebo členské státy Evropské unie, alespoň některé, zavázaly k tomu, že nasekvenují milion evropských genomů, což by byl právě skvělý dataset právě pro analýzy, na který by eh AI mohla eh právě identifikovat ty různé varianty, které jsou nebo nejsou významné a podobně. A v současné době sice i Česká republika je součástí této iniciativy, ale i na té evropské úrovni se stále řeší že sice jednotlivé státy a jednotlivé pracoviště mají lidské genomy nasekvenované, ale pro účely tady toho nadnárodního výzkumu je nemůžou sdílet právě z důvodu etických a legálních, protože není právě ošetřené to, že lidé souhlasili ve chvíli, kdy se ten jejich genom sekvenoval, tak nesouhlasili s tím, že ta jejich DNA bude využitá v nějakých velkých databázích, e, na kterých se potenciálně bude dělat další genomický výzkum. Takže to je teď v Evropě opravdu velké velké téma. A my jsme tady do těch projektů zapojení a eh opravdu jako ta etika samotná, ta se řeší eh v podstatě léta. Eh ta iniciativa vznikla v roce 2017 a od té doby vlastně se jednotlivé státy snaží a opravdu data generují, ale ale reálně prostě nejsou ve fázi, že by je mohly eh nebo mohly ty státy sdílet.
Já ještě akorát k tomu doplním, souhlasím a ano, ta legislativa bude na dlouho a jenom akorát my tady řešíme problém trošku jiný, než je u těch eh language modelu nebo u u tě toho dalý, kde to není tak jako že bysme poznali a to je můj obrázek, který byl použit, jo, takže bysme poznali, je to je můj gen, tady tolecto, to já nechcu. Tam jde spíš o to, aby nebyli ti lidé identifikovatelní, jak říkal pan kolega Pačes, že že na základě těch dat, který poskytneme, jo, aby prostě nemohl člověk jít a říct ano, tady ten člověk asi žije tady v České republice a já si ho najdu. Protože bohužel na základě celogenového sekvenování to v dnešní době jde určit lidí jenom na základě té sekvence, takže oni se ne dají efektivně anonymizovat. Já si myslím, že v rámci toho učení ta anonymizace čistá půjde a že na to už jako metody jsou, ale pořád potom ta federativní učení bude poměrně složité.
Možná, že to byl špatný směr tý otázky. Vlastně bysme se měli zeptat vás jako dali byste tu informaci nám k dispozici takovou to je upřímně řečeno zákony to je jenom kodifikace nějaká společenskýho souhlasu. Takže eh to si musíme tady mezi sebou říct, co chceme. A jestli byste toho byli jako ochotný tu informaci nám dát. Učastníte se třeba nějakých takovýhlech studií. Je tady někdo? Jo, já taky jsem se účastnil dvou takovlech studií. Jsem zvědavej, kde ty moje data teda jsou. Teďka, když se o tom mluvíme. Eh, ale eh je to individuální věc, jak si to každý rozhodne a pak musíme dojít k nějakýmu společenskýmu konsenzu. Nebude to jednoduchý.
Já bych právě jako zdůraznila to, že třeba já vidím pořád eh velký benefit a potenciál v tom, abychom ty genomy sbírali a analyzovali. Já mám svůj genom taky osekvenovaný a A samozřejmě byla bych nerada, kdyby to někdo Můžu si přijít sleš.
Eh, samozřejmě bych byla nerada, kdyby to někdo zneužíval a nedala bych souhlas k jeho využití k jakýmkoliv prostě experimentům a výpočetním analýzám, ale přijde mě dobře, když právě potom pro ty pacienty, kteří přichází a třeba ty data jako nemají eh dobře zanalyzované, tak máme vlastně nějaké vodítka, nějaké reference a něco vůči čemu to můžeme srovnat. Eh, a eh jako líp se to vyhodnocuje, eh má to benefit potom pro ty pacienty. Takže já v tom vidím obrovský potenciál. Samozřejmě má to svá rizika, ale co v dnešní době nemá rizika, to se zas na na rovinu musíme přiznat. A eh samozřejmě je pak na té vědecké komunitě, aby se snažila ty rizika eliminovat. A není to jenom otázka teda vědecké komunity, ale zároveň bych zdůraznila to, že je to otázka celospolečenská v podstatě a legislativní, jo. Takže že určitě si myslím, že to, že Evropa reguluje, je dobře, protože se snaží předcházet nějakému zneužívání, ale já v tom fakt vidím jako benefit, že že nás to může posunout dál e v té diagnostice v medicíně, takže se nechte sekvenovat.
To jenom technický bod, že e ten vědecký problém toho, jak jako síť odučit nějakou věc, je pořád otevřená vědecká otázka, že nevíme, jak se to dělá, že kdybychom třeba chtěli, aby jazykový model zapomněl na Hryho Patra nebo něco takového, tak jako reálně nikdo na světě neví, jak to udělat. Je možné netrénovat na tom Herotrovi. Asi to by bylo odfiltrovat úplně na začátku ta data, ale machine unlearning se tomu teďka říká jako otevřené otázce. Nevíme jak to udělat. Hodně z těch věcí, které bychom potenciálně jako společnost chtěli, nejsou otázky toho, že by je někdo nechtěl udělat nebo možná také jako potom, ale reálně jsou to otevřené technické problémy, u kterých neznáme ta řešení, což je taková to je jako aspekt toho, který často lidé podceňují, že jako očekávají, že ten ta věda je o hodně vyspělejší, než reálně je.
A já jsem ještě na to chtěl navázat jednou ale věcí, že když zase si ty dveře příliš zav řeme, tak se nám může lehce stát, že budeme mít AI, který budou natrénovaný na jiných kulturních základech, než máme my tady a pak nám budou radit něco, co třeba bysme ani nebyli rádi. V medicíně to víme dobře, že velká většina léků funguje dobře na tu na populaci bílou, teda, protože na tom se to většinou trénovalo a podstatně hůř funguje třeba na afroamerickou. Takže to víme, že tydlety BIOSy, ty ovlivnění prostě jenom tím, že nebylo při těch klinických studiích dřív prostě nebylo udělaný dobře, aby byli všichni zastoupeni. Takže do dneška se to projevuje v tý medicíně a tady se nám by se nám to taky lehce mohlo stát v tý AI. Takže jedna věc je dát si pozor, ale druhá věc je to nepřehnat. Tu hranici neumí nikdo asi říct. No, je to těžký.
Dobře, pojďme na ten další dotaz. Eh, máte tam mikrofon. Dobrý den. Já bych se rád zeptal na jednu věc. Tam padla taková poznámka vlastně, že AI není dokonalá. Pak tam byl nějaký komentář, protože vlastně čerpá z nějakých lidských textů. Já bych se právě právě rád zeptal na tole, jestli v tom právě není ten jako hlavní problém, protože prostě lidi si myslí, že třeba AI je jako nějaké soběstačné vědomí, ale reálně je to vlastně program, který napsali lidé a ta znalostní báze vlastně toho systému programu čerpá právě z nějakých jako lidských anotací, který vlastně vytvořili lidé, kde vlastně je ta hranice, kdy vlastně dá se říct, že ta AI je vlastně tak chytrá, jak jsme chytří my. A případně kde je třeba ten bod, kdy už eh ta AI začne být jako sama vlastně soběstačná a chytrá a nebude čerpat z těch lidských chyb, protože tam ten lidských faktorů přece jenom hraje velkou roli, že vlastně by se dalo říct, že můžeme AI pod e vlastně podstrčit nějaké jako nepravdivé informace a ona je zpracuje nějakým způsobem také nepravdivě.
To je skvělá otázka. Asi jedna taková jako miskoncepce tam je to, že to není program napsan lidmi. E to je fundamentální rozdíl od toho, jak třeba vypadá jiný počítačový program. Třeba když bych chtěl navrhnout něco, co setdí hromadu čísel od nejmenšího po největší, tak takový algoritmus je mnou přesně napsan a v každém kroku vím přesně, co to dělá. To napíšu krok po kroku, ale říkám počítači, který je Extrémně dobrý v tom dělat hodně operací po sobě, ale extrémně hlubý v interpretaci přesně, co má udělat a potom vyplivne třeba sérii čísel od nejmenšího po největší nebo cestu v Google mapách mezi městy, která je nejrychlejší, když to už taky používá dneska AI. Ale fundamentální rozdíl s těmi naučenými řešeními, jako jsou třeba věci ve strojovém učení, což jsou ty věci, které stojí za třeba chat GPT, je to, že my sice napíšeme ten program, který trénuje tu věc, jak třeba ty data krabíme do toho modelu, jak jsou ty neurony v rámci toho modelu propojené, ale už neřekneme, jak silné ty propojení jsou a ten trénink té sítě spočívá v tom, že ta síla těch propojení, těch synapsí se mění během tomu vystavení těm datům. Takže my sice nastavíme jakoby tu vrchní smyčku toho, co to dělá, říkáme tomu, tady jsou data, tohleto máš odpovídat, ale neřekneme tomu jak. A to je přesně ta magie eh té té AI. My neumíme explicitně napsat, jak třeba vyřešit klasifikaci obrázků na to, jestli je to pes, kočka, žalva nebo dům. Eh, nevíme, jak říct, když tady ten pixel bude takhle velikej, tak potom řekni, že je to kočka. Jinak řekni, že je to dům. Pokud tamhlen jinej pixel bude mít takovouhle hodnotu a takovouhle barvu, tak pak Řekni, že je to kočka. Eh, takový přístupy byly na začátku vývoje AI, třeba v 50. 60. letech, ale nikdy nefungovaly. Oni jsou extrémně křehký v tomhletom. To, co reálně funguje, je naučení automaticky obrovskýho amorfního množství synapsí mezi simulovanýma neuronama. V podstatě se to trochu podobá konceptuálně lidskýmu mozku v tom, že jsou tam jednotky, kterým říkáme neuróny a propojení. Jejich síla eh upravuje to, jak silnej signál jima prochází a během toho učení se maličko upravujou tady ty síly těch propojení. Těch propojení je třeba e, bilion v rámci třeba GPT4 a během tréninku se upravujou maličkej kus po maličkým kuse a na konci z toho vypadne něco, co umí trochu přemejšlet. Ale my netušíme, jak to dělá. My nemáme napsanej program, eh, kterej by nějak explicitně říkal, když tady je nějaký slova, tak řekněme tamhle to jiný slovo a takhle. Je to extrémně amorfní a extrémně takový jako jak jsme se bavili o těch černých skříkách, tak to je ono, že my nevíme, jak přesně to tu věc dělá. Takže to není program v tomhletom. E, to byla asi první věc, o který jsem měl zapomněl zbytek otázky. A tohleto je podle mě hodně dobrá distinction, která kterou si lidi často neuvědomují, když mluví o AI. Oni si představují, že to je nějaká databáze, která má třeba všecky knížky a pak najde tu nejbližší a podle ní odpoví. Ale reálně všechny tady ty informace existujou. Zakódovan v nějakejch váhách a dloužkách synapsí mezi simulovanejma neuronama. Podobně jako v lidicky v mozku není nějaká explicitně zapsaná knížka a její obsah nebo Harry Potter není koncept, kterj by tam někde existoval v jednom bodě a to bylo všechno. Je to nějak jako amorfně v rámci všech neuronů. Takže to je asi jako jedna věc, kterou bych chtěl zmínit.
Ale pořád to trénujeme na těch lidských datech, ne? To byl smysl té otázky.
A jo, to je pravda. že kdyby měl přístup k nějakým, mono je to vždycky zprostředkovaný skrz nějaký senzory, ale vlastně svojí přímou zkušenost a pozorování, tak by to bylo kvalitativně jiný.
Eh, já si myslím, že to, že to jsou lidská data asi nějaká limitace je. Na druhou stranu to nejsou jen lidská data, jsou to třeba výpočty v aritmetice, jsou to kusy programů, jsou to i hodně jiné typy dat, než třeba jenom příběhy nebo než jako konverzace mezi lidmi. A eh schopnost predikovat další slovo v rámci matematického výpočtu v sobě tak jako zahrnuje schopnost dělat matematiku. Takže jako ty schopnosti, které se to naučí během té pr těch dalších slov na tom hodně širokém korpusu se možná v něčem podobají lidem, ale často dělají o hodně těžší úlohu, než třeba lidé typicky vykonávají. Třeba předvídají eh jo, třeba v té matematice nebo v tom programování, to je něco, co typický člověk nedělá. A typicky tady ty operace eh se dají eh třeba provádět po sobě a trénovat jinou AI na výsledku několika takových roků po sobě, což jakoby vezme výstup něčeho jako je inteligence e pod nějakou dobu a snaží se jí nějak jako destilovat do kroku který vede od toho zadání k tomu výsledku rovnou. Takže jsou tady takové kroky, které amplifikují tu inteligenci na tu úroveň těch dat, eh, ve kterých se vyskytuje. Takže to jsou asi není to nutně fundamentální limit. Ta AI může přemýšlet rychleji, déle a minimálně má o hodně širší znalosti a o hodně větší operační paměť. Třeba ten model Cloud 3 od Antropicu, kde jsem pracoval a který jsem spolu vyvíjel, tak ten obsáhne víceméně velikost dvou románů velký Gsby po sobě a má to najednou v operační paměti a vidí to úplně přesně, stejně čistě a dobře, jakoby člověk třeba viděl pět, šest čísel, které se zapamatuje. Takže už jen schopnost věnovat se kontextu, který je dlouhý jako dva romány najednou, je něco, v čem je to ohlské, i kdyby ta schopnost přemýšlet byla jenom lidská, což je jako docela fundamentálně velký rozdíl. E,
může se stát, že by vlastně byl jeden obraz nebo nějaký obrázek předložen té síti a byl udělán třeba dvakrát a pokaždý by byl jiný výsledek, může se to stát jako, že může pracovat jako pokaždý jinak, jo, i když vlastně má stejné data, stejný vstup a měl by teda různý výsledky. Může se to stát při tom učení třeba aj
ty věci nejsou stochastické, takže typicky to dopadne úplně stejně, ale je tam nějaká chybovost na té hardvérové úrovni. Ty grafické karty nejsou úplně přesné, občas trefí nějaký kosmický paprsek, nějaký ten procesor a to způsobí změnu by, takže je tam nějaká stochasticita, ale fundamentálně to není udělané stochasticky.
Takže je to vlastně kdyžtak chyba potom toho systému, kdyby to vypadalo jinak.
Ano, je to chyba.
Na druhou stranu, když se v chatu GPT zeptáte na stejnou věc vícekrát, tak odpoví pokaždé jinak,
protože tam je nějaká náhod tom, jak se vyčítají ty slova z toho modelu. Ono to řekne, že nejpravděpodobnější je třeba slovo já, druhé nejpravděpodobnější je ty a občas si to náhodně vybere jako i to méně pravděpodobné. Tak v tom je tam nějaká stochasticita, ale ten model to predikuje eh aspoň tak, jak je chápu, vždycky stejně
jakože obsah je stejný, ale jako formulace může být trochu jiná, jo, nebo že
ne, že jako když mu dám kontext tisíce slov, tak ta predikce toho, jaká je pravděpodobnost dalšího dalšího slova, je vždycky stejná, ale jaké konkrétní slovo se z té pravděpodobnosti zvolí, jen částečně náhodné. A tudíž, když ho pak přidám k tomu kontextu a jdu dál, tak z toho to jakoby postupně hodně rychle ty dvě verze od sebe oddálí.
Já bych měla dotaz na všechny, když už jsme takhle na konci té diskuze. Který aspekt té umělé inteligence vás jako baví, nebo co vás jako motivuje s ní pracovat jakoby obecně?
Z mého pohledu to usnadňuje práci. Já nemůžu říct, že bych byla nějaký široký uživatel nebo jako že bych s tím pracovala prostě úplně každou hodinu své práce nebo každý den, ale tam, kde to potřebujeme, tak to pomáhá.
Mně se na tom nejvíc líbí ta představa, že tu umělou inteligenci dokážu začlenit do svýho typu přemýšlení, že ty věci, který ona mi udělá dobře, tak já už na nim nebudu muset trávit čas a ona to udělá a budu s ní takhle spolupracovat. Já bych byl asi docela rád takovej kybor, kterej by to uměl, ale to je těžký na to myšlení, jo, umět to svoje myšlení takhle nějak rozpoltit a to, co jde tý inteligenci dobře, tak to to jsem na to mně líbí nejvíc a vidím v tom, si myslím i pro to lidstvo takovou dobrou budoucnost.
Mě na tom baví vlastně ta ta blackboxovost, ta neznámost. a že nahradím to, co ti lidi si říkají, jo, tak já se podívám tady, jakou bude mít asi diagnózu a místo toho my uděláme takový jako trik, že vlastně jenom tam nasypeme nějaká data a pak predikujeme vlastně ty diagnózy těch jak jako jak jako budou mít přežití a tak. A mně se líbí tady, že vznikají takové modely, které vlastně překlenou přímo čarost těch jednotlivých kroků. A a to mě na tom přijde jako zajímavý, že že řeknu: "OK, vy to děláte nějak a teďka co kdybysme to udělali jako jinak lépe a a ono to občas funguje a A to pak z toho člověk má radost.
To mě na tom nejvíc rozčiluje, takže nevím, jak to
pan Ford ještě
mě tebe asi osobně dennodenně baví nejvíc to, jak neprozkoumanej ten obor je a jak je to úplně jako novej typ věci, která je extrémně komplexní, zajímavá a užitečná, kterou můžeme studovat úplně od něčeho. Není to jako kdybychom měli 1000 letou historii studia, biologie nebo čehokol, ale je to úplně novej typ entity, která je zajímavá, užitečná, komplexní a my jsme teďka úplně na začátku jejího studia, takže v podstatě otvíráme úplně novej obor eh aspoň úplně novýho horizonty a skoro každá věc, nad kterou se zamyslím, je nová a můžu ji prozkoumat, jako kdyby nikdy předtím nebyla prozkoumaná. Takže ta novost a ta otevřenost těch horizontů se mi hodně líbí.
Já se chci zeptat, jestli jsou nějaké aspoň zhruba definované jakoby cíle té AI, jakoby kdy si řekneme, že už to stačí, kdy už ten vývoj jakoby nepůjde dál.
Děkuju. To si myslím, že si nikdy neřekneme. To je princip toho lidstva, no, že jdeme pořád dál. Takže to stačit nebude nikdy. Vždycky to bude lepší nebo to půjde dělat rychleji, nebo to půjde dělat za menší množství. energie. Nevidím horní hranici.
Já si myslím, že jedna věc je definování si cílu, pro co chceme AI používat. Tak tam možná nějakých konkrétních cílů se dá dosáhnout, ale eh souhlasím s tím, že že člověk je trochu nenasytný druh a když si může v něčem usnadnit práci, tak to rád udělá a ta AI, pokud mu s tím pomůže, tak eh to ten člověk rád použije. No
já akorát jestli k tomu doplnit, tak já myslím, že správná poznámka je v tom, že to člověk je ten na druh, ne ta AI, protože každý ten jednotlivý model se naučí jenom to, co my mu řekneme, že se má naučit, jo, a ty data, co mu dáme a ty cíle, co mu zadáme, tak on se to naučí. Ale to, že chceme furt trénovat víc a víc a nově a lépe, tak to je náš problém. Jo,
já ještě můžu dodat, já si myslím, že to trošku souvisí s dynamikou doby, protože se od nás očekává víc eh v kratším čase, takže potom prostě to automaticky spe, že hledáme nástroje, jak ty výsledky získat sá nás a rychleji.
Mně ta cílová čára přijde hodně daleko. Přijde mi, že až vyléčíme smrt a rozšíříme se jako druh po galaxii, tak asi už bude konec. Ale do tý doby se mi nezdá, že existuje nějaká fundamentální čára, kde bychom měli zastavit. Já mám pro lidstvo docela velký aspirace. Nemyslím si, že z toho dožijeme. Neříkám, že to bude zítra, ale fundamentálně nevidím, proč bychom neměli tyhlety technologie a a vědu obecně používat tomu, abychom obecně zlepšovali naše podmínky, abychom si přizpůsobovali svět k tomu, abychom žili kvalitnější, lepší, plnohodnotnější životy ve větším počtu. třeba eh žijeme na jedné planetě, vesmír je obrovský, proč nepračovat dál. AI nám potenciálně může automatizovat vědu a inovace a technologický vývoj a to nám může uvolnit e tady tu cestu dál. Takže já si myslím, že já nevidím žádný jako blízký limit vyléčení smrti a šíření se po galaxii zní jako tak nějak ta středně dobá predikce.
Já jsem proti vyléčení smrti.
Se namítnout, že je pak otázka, jestli to budeme my, kdo se bude po tý galaxii ještě šířit, nebo už ta AI. Ale to už asi musíme na napříště, protože bohužel, jakkoliv je to strašně zajímavý, tak časovej limit už vypršel. Tak moc děkujeme publiku za pozornost a zajímavé otázky a strašně moc děkujeme našim hostům za strašně zajímavý vhledy a za to, že nás provedli touhletou složitou interakcí dvou komplikovaných oborůské činnosti.
My děkujem za pozvání. Bylo to skvělý. Tady
připomínám, že jste slyšeli Vojtěcha Bystrého, Jana Pačesa, Karlu Plevovovou a Stanislava Forta. Já taky Tak mockrát děkuju vám za vaše dotazy. Ve mně tedy zůstává možná víc otázek než odpovědí, ale to je možná dobře. Není.
Tak díky moc.
Díky. Nasleženou a na viděnou se také těší Martin Uhlíř a Štěpán Sedláček. Vítejí respekt.