AI-onderzoekstools zoals OpenAI o1 hebben nu testscoreniveaus bereikt die gelijk zijn aan of hoger zijn dan de scores van degenen met een Ph.D. graden in de wetenschappen en een aantal andere gebieden. Deze generatieve AI-tools maken gebruik van grote taalmodellen die onderzoek en kennis uit vele disciplines omvatten. Ze worden steeds vaker gebruikt voor het bedenken van onderzoeksprojecten en het zoeken naar literatuur. De tools genereren interessante inzichten voor onderzoekers waaraan ze in de afgelopen jaren misschien niet zijn blootgesteld.
In de academische wereld wordt lange tijd de nadruk gelegd op onderzoek met één discipline. We bieden graden in afzonderlijke disciplines; faculteitsleden krijgen meestal benoemingen in slechts één afdeling, school of hogeschool; en voor het grootste deel bestrijken onze peer-reviewed wetenschappelijke tijdschriften slechts één discipline, hoewel ze soms artikelen uit nauw verwante of aanverwante vakgebieden verwelkomen. Proefschriften zijn meestal gebaseerd op één discipline. Hoewel onderzoekssubsidies vaker multidisciplinair zijn en prioriteit geven aan het vinden van praktische oplossingen, blijft een groot aantal onderzoekssubsidies gericht op één vakgebied.
Het probleem is dat naarmate we onze kennis en toepassingsexpertise op één gebied vergroten, we ons niet bewust kunnen zijn van belangrijke ontwikkelingen op andere gebieden die direct of indirect van invloed zijn op het onderzoek in het door ons gekozen vakgebied. Innovatie is niet altijd een lineaire vooruitgang met één doel. Tegenwoordig komt innovatie steeds vaker voort uit de integratie van kennis op uiteenlopende gebieden, zoals sociologie, techniek, ecologie en milieuontwikkelingen, en het vergroten van het begrip van de kwantumfysica en kwantumcomputers. Tot voor kort hadden we geen efficiënte manier om kennis en perspectieven te identificeren en te integreren uit vakgebieden die op het eerste gezicht niets met elkaar te maken lijken te hebben.
AI-futurist en innovator Thomas Conway van het Algonquin College of Applied Arts and Technology behandelt dit onderwerp in “Harnessing the Power of Many: A Multi-LLM Approach to Multidisciplinaire Integration”:
“Te midden van de urgentie van steeds complexere mondiale uitdagingen is de behoefte aan integratieve benaderingen die de traditionele disciplinaire grenzen overstijgen nog nooit zo cruciaal geweest. Klimaatverandering, mondiale gezondheidscrises, duurzame ontwikkeling en andere urgente kwesties vragen om oplossingen vanuit diverse kennis en expertise. Het effectief combineren van inzichten uit meerdere disciplines is echter lange tijd een belangrijk obstakel geweest in de academische wereld en het onderzoek.
“De Multi-LLM Iterative Prompting Methodology (MIPM) komt naar voren als een transformatieve oplossing voor deze uitdaging. MIPM biedt een gestructureerd maar flexibel raamwerk voor het bevorderen en verbeteren van multidisciplinair onderzoek, peer review en onderwijs. In de kern richt MIPM zich op de fundamentele kwestie van het effectief combineren van diverse disciplinaire perspectieven om tot echte synthese en innovatie te leiden. Het transformerende potentieel ervan is een baken van hoop in het licht van complexe mondiale uitdagingen.”
Zelfs als we AI-onderzoeksinstrumenten en -technieken integreren, veranderen wij, onszelf en onze samenleving als geheel. Veel van de gemeenschappelijke grenstaalmodellen die onderzoeksinstrumenten aandrijven, zijn multidisciplinair van aard, hoewel sommige zijn ontworpen met sterke punten op specifieke gebieden. Hun reacties op onze vragen zijn multidisciplinair. De reactie op onze iteratieve vervolgvragen kan ons naar vakgebieden en expertisegebieden brengen waarvan we ons voorheen niet bewust waren. De antwoorden komen niet uitsluitend van één enkele discipline-expert, boek of andere bron. Ze komen voort uit een enorm taalmodel dat disciplines, talen, culturen en millennia omvat.
Naarmate we deze instrumenten integreren, zullen ook wij ons vanzelfsprekend bewust worden van nieuwe en opkomende perspectieven, onderzoek en ontwikkelingen die voortkomen uit gebieden die buiten onze dagelijkse kennis, training en expertise liggen. Dit zal onze perspectieven uitbreiden buiten de gebieden van onze formele studie. Naarmate de kwaliteit van onze op AI gebaseerde onderzoeksinstrumenten toeneemt, kan hun impact op het onderzoek niet genoeg worden benadrukt. Het zal ons in nieuwe richtingen en bredere perspectieven leiden en het potentieel voor nieuwe kennis blootleggen, gebaseerd op meerdere disciplines. Een recent voorbeeld is Storm, een brainstormtool ontwikkeld door het team van Stanford’s Open Virtual Assistant Lab (OVAL):
“De kerntechnologieën van het STORM&Co-STORM-systeem omvatten ondersteuning van Bing Search en GPT-4o mini. De STORM-component genereert iteratief overzichten, alinea’s en artikelen via vraag-en-antwoordsessies vanuit meerdere invalshoeken tussen ‘LLM-experts’ en ‘LLM-hosts’. Ondertussen genereert Co-STORM interactieve dynamische mindmaps via dialogen tussen meerdere agenten, zodat de gebruiker geen informatie over het hoofd hoeft te zien. Gebruikers hoeven alleen een Engels onderwerp-trefwoord in te voeren en het systeem kan een lange tekst van hoge kwaliteit genereren waarin informatie uit meerdere bronnen is geïntegreerd, vergelijkbaar met een Wikipedia-artikel. Bij het ervaren van het STORM-systeem kunnen gebruikers vrij kiezen tussen de STORM- en Co-STORM-modi. Gegeven een onderwerp kan STORM binnen 3 minuten een gestructureerde lange tekst van hoge kwaliteit produceren. Bovendien kunnen gebruikers op ‘BrainSTORMing Process bekijken’ klikken om het brainstormproces van verschillende LLM-rollen te bekijken. In de sectie ‘Ontdekken’ kunnen gebruikers verwijzen naar artikelen en chatvoorbeelden die door andere wetenschappers zijn gegenereerd, en persoonlijke artikelen en chatrecords zijn ook te vinden in de zijbalk ‘Mijn bibliotheek’.’
Meer over Storm is beschikbaar op https://storm.genie.stanford.edu/.
Een van de zorgen die sceptici op dit punt in de ontwikkeling van deze onderzoeksinstrumenten naar voren brengen, is de veiligheid van aanwijzingen en resultaten. Weinigen zijn zich bewust van de mogelijkheden voor air-gapped of gesloten systemen en zelfs de tijdelijke ChatGPT-chats. In het geval van OpenAI kunt u een tijdelijke chat starten door bovenaan de GPT-app op de versie van ChatGPT die u gebruikt te tikken en tijdelijke chat te selecteren. Ik doe dit vaak door Ray’s eduAI Advisor te gebruiken. OpenAI zegt dat in de tijdelijke chatmodus de resultaten “niet in de geschiedenis zullen verschijnen, geen herinneringen zullen gebruiken of creëren, of zullen worden gebruikt om onze modellen te trainen. Uit veiligheidsoverwegingen kunnen we een kopie maximaal 30 dagen bewaren.” We kunnen anticiperen dat dit soort bescherming door andere aanbieders zal worden geboden. Dit kan voor veel toepassingen voldoende beveiliging bieden.
Verdere beveiliging kan worden geboden door een stand-alone exemplaar van de LLM-database en -software te installeren op een computer met luchtopening die de gegevens volledig loskoppelt van het internet of enig ander netwerk, waardoor een ongeëvenaard beschermingsniveau wordt gegarandeerd. Kleine taalmodellen en middelgrote modellen leveren indrukwekkende resultaten op, waarbij ze de prestaties van grensmodellen benaderen en in sommige gevallen zelfs overschrijden, terwijl alle gegevens lokaal en offline worden opgeslagen. Vorig jaar introduceerde Microsoft bijvoorbeeld een reeks SLM- en mediummodellen:
“De ervaring van Microsoft met het leveren van copiloten en het mogelijk maken van klanten om hun bedrijf te transformeren met generatieve AI met behulp van Azure AI heeft de groeiende behoefte aan modellen van verschillende grootte over de kwaliteit-kostencurve voor verschillende taken benadrukt. Kleine taalmodellen, zoals Phi-3, zijn vooral geschikt voor:
- Omgevingen met beperkte bronnen, inclusief scenario’s voor inferentie op het apparaat en offline
- Latency-gebonden scenario’s waarbij snelle responstijden van cruciaal belang zijn.
- Gebruiksscenario’s met beperkte kosten, vooral die met eenvoudigere taken.”
Op korte termijn zullen we kant-en-klare privézoektoepassingen vinden die nog indrukwekkendere resultaten zullen opleveren. Er wordt verder gewerkt aan snel toenemende multidisciplinaire reacties op onderzoek naar een steeds groter aantal urgente onderzoeksonderwerpen.
De steeds evoluerende AI-onderzoeksinstrumenten bieden ons nu antwoorden uit meerdere disciplines. Deze resultaten zullen ons ertoe aanzetten meer multidisciplinaire onderzoeken uit te voeren die een katalysator zullen worden voor verandering in de academische wereld. Gaat u interdisciplinaire onderzoeksstudies overwegen en uw collega’s uit andere vakgebieden betrekken bij onderzoeksprojecten?