Übersicht: Generative KI - MZ Hofgeismar | Wolfhagen
Jörg SchwagmeierWas ist Künstliche Intelligenz?
Begriffs- und grundlegende technische Klärung
-
Künstliche Intelligenz (KI) ist ein Teilgebiet der Informatik. Sie imitiert menschliche kognitive Fähigkeiten, indem sie Informationen aus Eingabedaten erkennt und sortiert. Diese Intelligenz kann auf programmierten Abläufen basieren oder durch maschinelles Lernen erzeugt werden.
- *(Quelle: Fraunhofer-Institut für Kognitive Systeme IKS)*
-
Diese Definition umfasst weit mehr als nur das, was wir aktuell im öffentlichen Diskurs als "KI" betiteln. Ein System wie ChatGPT zählt präziser zu einer des Machine Learnings, den generativen Machine-Learning-Systemen. Dabei ist Machine Learing (ML) selbst nur ein möglicher Computing-Ansatz.
-
Mehr dazu für Interessierte hier:
-
GPT ist die Abkürzung für Generative Pre-trained Transformer.
-
- Generative ML-Systeme generieren, also erzeugen, Text, Bilder, etc..
-
- Pre-trained, also vortrainiert, bedeutet, dass das ML-System, auf dem die jeweilige Anwendung basiert, bereits auf Grundlage bestimmter Daten zu einem bestimmten Zeitpunkt durch maschinelles Lernen trainiert wurde. Das Ergebnis dieses Trainings wurde in Form eines Modells gespeichert. Auf die jeweiligen Modelle kann später zurückgegriffen werden.
-
- Transformer sind ML-Systeme, welche aus bekannten Daten (Text, Bild, etc.) andere Daten erzeugen. Sie transformieren Daten mithilfe von Machine Learning unter Verwendung des Aufmerksamkeitsprinzips (Attention). Durch dieses Prinzip werden nur die stärksten errechneten Signale in einem neuronalen Netzwerk mit der vermutlich hilfreichsten Information, z. B. hinsichtlich des nächsten auszugebenden Wortbausteines eines Textes in einem spezifischen Kontext, berücksichtigt. Es existiert in generativen Systemen zur Texterzeugung keine Verständnishierarchie von Wörtern oder gar ganzen Sätzen. Nur auf diese Weise kann die enorme Performanz von Systemen wie ChatGPT überhaupt erst erreicht werden.
-
Mehr dazu für Interessierte hier:
-
Weiterhin wichtig…
-
- Mithilfe von Large Language Models (LLMs; große Sprachmodelle) lassen sich alle digital repräsentierbaren Objekte (Texte, Bilder, Töne, Videos, 3D-Modelle, Molekülstrukturen, etc.) generieren bzw. von einem Datentyp in einen anderen überführen (z. B. lassen sich aus Texten Bilder erstellen).
-
- ML-Systeme des Typs GPT erzeugen mitunter sachliche und/oder logische Fehler, da sie kein inhaltliches Verständnis besitzen, sondern das statistisch Erwartbare anhand ihrer LLMs ausgeben.
-
- LLMs werden zur Anpassung an ganz bestimmte Anwendungsanforderungen dem sogenannten Fine Tuning unterzogen. OpenAI setzt bei ChatGPT auf ein zweites neuronales Netzwerk für diesen Vorgang. Dieses zweite neuronale Netz (Optimierer) wird durch den Ansatz des Reinforcement Learnings (Verstärkungslernen) durch menschliches Feedback vortrainiert. Es dient der Beurteilung der Güte bzw. Erwünschtheit der Datenausgabe. Anschließend treffen die beiden neuronalen Netze (GPT und Optimierer) in einer virtuellen Umgebung aufeinander und interagieren nach dem Trial-and-Error-Prinzip miteinander. Das Ergebnis ist in diesem Fall eine auf Konversation abgestimmte Anwendung.
-
Bias...
-
www.dguv-lug.de LINK
Unterschiedliche Modelle für unterschiedliche Aufgaben
-
Man unterscheidet Reasoning- und GPT-Modelle.
-
"[Die] Reasoning-Modelle [wurden] darauf trainiert, länger und gründlicher über komplexe Aufgaben "nachzudenken". Sie eignen sich besonders für:
-
- Navigation durch mehrdeutige Aufgaben aus dem Bereich Mathematik, Engineering, Recht, Finanzen und Co.,
- Analyse großer Datenmengen,
- Erkennen von Zusammenhängen,
- mehrstufige Planungsprozesse,
- visuelle Analyse,
- Code-Review und -Verbesserung.
-
Die GPT-Modelle („die Arbeitspferde“) hingegen sind optimiert für:
-
- schnelle Ausführung definierter Aufgaben,
- kostengünstige Verarbeitung,
- geringere Latenzzeiten.
-
Für optimale Ergebnisse empfiehlt OpenAI, die Modelle zu kombinieren: Reasoning-Modelle für Planung und Entscheidungsfindung, GPT-Modelle für die Ausführung.
- Die Prompts sollten dabei möglichst einfach und direkt sein – klassische Prompt-Engineering-Techniken (–> weitere Hinweise) sind bei den Reasoning-Modellen nicht nötig, da sie diese Prozesse bereits intern durchführen (Quelle)."
-
Ausführliche Best Practices für die Verwendung von Reasoning-Modellen:
-
platform.openai.com LINK
-
Erklärung des Reasonings bei LLMs im Video:
-
-
Anthropic bietet ab Claude 3.7 Sonnet eine Lösung an, die GPT- und Reasoning-Modell automatisch miteinander vereint. Hier kann für die Inanspruchnahme der Reasoningfunktion in den "Extended-Modus" gewechselt werden. Beim Prompten muss hier keine Rücksicht mehr auf die Spezifika des Sprachmodelltyps genommen werden.
Prompting
-
Mehr zum Thema Prompting auf der Info-Seite des Medienzentrums Frankfurt:
-
…Lernkarten des MZ Frankfurt:
-
-
Weitere Tipps inkl. Handreichung und Ausführung bzgl. der Nutzung von Reasoning-Modellen und der Bedeutung des Promptings im Blog von Manuel Flick:
-
www.manuelflick.de LINK
Lehren und Lernen im Zeitalter von KI
KI-Kompetenzmodell nach Alles, Falck, Flick und Schulz
-
Ein erster Entwurf eines umfänglichen Kompetenzmodells:
-
"KI-Kompetenzen für Lehrende und Lernende. Aus der Praxis für die Praxis – eine adaptierbare Basis"
-
Das KI-Kompetenzmodell nach Alles, Falck, Flick und Schulz:
-
Eine umfassende TaskCards-Sammlung mit Detailgrafiken, Materialien und Hintergründen rund um die Publikation steht hier bereit:
-
essen.taskcards.app LINK
-
Die Publikation ist im PDF-Format unter dem folgender URL abrufbar:
-
doi.org LINK
-
Informationen zur Genese:
-
www.vkkiwa.de LINK
-
-
Präsentation des Modells im Rahmen einer Online-Panel-Diskussion der Robert Bosch Stiftung am 10. April 2025 – zur Anmeldung:
Einsatz generativer ML-Systeme und Lernmotivation
-
"[…] an important step towards AI systems that can truly augment human capabilities. […] a future where AI enriches and expands what humans can achieve." (Quelle)
-
-
Wozu soll ich eigentlich noch Lernen? – "Neben den konkreten Einsatzszenarien von GMLS vor, während und nach dem Unterrichts besteht langfristig die grösste Herausforderung von GMLS darin, dass sie die Lernmotivation von Schüler:innen der Sekundarstufen I und II senken kann. Schüler:innen werden sich zunehmend fragen, weshalb sie etwas lernen sollten, dass die Maschine rascher und besser kann als sie - in gewissen Fällen selbst dann, wenn sie sich anstrengen und entsprechend lernen. Lehrpersonen müssen sich somit Gedanken machen, wie dieser Gefahr vor weiter sinkender Lernmotivation begegnet werden soll. Dabei ist zu beachten, dass dies keine Frage ist, die durch IT- oder Digitalisierungsspezialist:innen beantwortet werden kann."
-
wörtlich zitiert von:
-
gmls.phsz.ch LINK
-
-
Folgende Grafik, erstellt von Joscha Falck, könnte einen Lösungshinweis geben:
-
Weitere Anregungen und nützliche Materialien wie Handlungsleitfäden zum Unterrichtseinsatz generativer ML-Systeme finden Sie im Blog von Manuel Flick:
-
www.manuelflick.de LINK
Unterrichtsplanung "mit KI"
-
- Brott, M. & Egerer, C. (2023): Kann eine KI besser Unterricht planen als Lehramtsstudierende? – ein Bericht aus dem innovativen Lehrprojekt CUKI (Chemieunterricht geplant durch künstliche Intelligenz); Achtung: sehr kleine Stichprobe, explorative Kleinstudie:
-
www.uni-potsdam.de LINK
-
"Grundlegend fiel auf, dass die KI-Planungen deutlich allgemeiner und weniger konkret formuliert waren, wodurch zwei Kriterien nicht valide bewertet werden konnten. Die Stärken des Chatbots lagen vor allem im Bereich der Stimmigkeit mit dem Lehrplan und des Vorhandenseins eines roten Fadens. In den Kriterien Lernziele, Differenzierungsmaßnahmen und Handlungsalternativen schnitten die Ergebnisse der KI eher schlecht ab. […] Jedoch zeigt dies, dass die KI trotz des niedrigeren Skalenwerts eine basale Planungsgrundlage liefert und die beste Planung von ChatGPT sogar besser war als die schlechteste Planung der Studierenden."
-
…Prompting ist entscheidend:
-
"Je detailreicher und genauer ein Prompt formuliert ist, desto maßgeschneiderter ist die Antwort des Chatbots. […] [D]ie Studierenden mit hoher Planungskompetenz [generierten] auch die besten KI-Entwürfe und die mit niedriger Planungskompetenz die schlechtesten Ergebnisse mit ChatGPT. […] In der Analyse der Prompts der Studierenden, die besonders gute Ergebnisse erzielten, ergaben sich einige Elemente, die zu einem guten Prompting zur Unterrichtsplanung beigetragen haben. Dazu gehören die Nennung zu implementierender Kontexte und Experimente, wichtiger didaktischer Rahmenbedingungen und Anforderungen wie Phasierung, Impulse, Vorwissen, Bundesland, Klassenstufe, Schulart und Zeitrahmen sowie formaler Vorgaben an die Unterrichtsplanung (z.B. Ausgabe als Tabelle)."
Datenschutz
Hinweis
-
Bitte überprüfen Sie stets die Datenschutzkonformität aller – auch der auf dieser Edumap aufgeführten – Dienste zum Zeitpunkt der Verwendung! – Beachten Sie ferner die entsprechenden Hinweise aus der Handreichung des HMKB.
-
Beachten Sie außerdem den Selbstlernkurs der Lehrkräfteakademie zum Thema Datenschutz.
-
-
Aktuell wird an Softwarelösungen gearbeitet, die private und personenbezogene Daten lokal pseudonymisieren, bevor die Anfrage an das Sprachmodell in der Cloud übermittelt wird.
-
Beispielhaft sei PrivatePrompts genannt:
-
github.com LINK
-
"Die Entwicklung von Private Prompts wird im Zeitraum 1.9.2024-28.02.2025 gefördert durch das Bundesministerium für Bildung und Forschung und den Prototype Fund (Förderkennzeichen 01IS24S44)."
Generative ML-Systeme für unterschiedliche Zwecke (beispielhafte Auswahl)
Texte und Sprache
-
- Text erzeugen und transformieren:
-
chatgpt.com LINK
-
claude.ai LINK
-
OpenAI (GPTx) und Anthropic (Claude) bieten derzeit die fortgeschrittensten allgemeinen Lösungen in diesem Bereich an.
-
…ohne Registrierung begrenzt nutzbar, teils inklusive Suchfunktion und der Möglichkeit, das LLM frei aus einer vorgegebenen Auswahl zu wählen (z. B. zum Vergleichen der Ausgaben):
-
duckduckgo.com LINK
-
DuckDuckGo Chat ist aus datenschutzrechtlicher Sicht empfehlenswert (Stand 20.02.2025). Zudem bietet die Plattform die Möglichkeit, aus mehreren LLMs zu wählen, sodass ein Vergleich der erzeugten Ausgaben möglich ist.
-
www.perplexity.ai LINK
-
Perplexity vereint Internetrecherche und generative ML-Systeme in fortschrittlichster Art und Weise miteinander. Auch wenn mittlerweile andere Lösungen existieren, so sticht dieser Dienst noch immer im Vergleich positiv hervor (Stand 20.02.2025).
-
chat.mistral.ai LINK
-
Mistral le Chat ist ein europäische Lösung basierend auf einem Open-Source-LLM. Hinsichtlich Datenschutz und Transparenz ist diese Lösung im unmittelbaren Vergleich zu ähnlich leistungsfähigen Applikationen empfehlenswert.
-
- Text schreiben/Feedback geben:
-
www.deepl.com LINK
-
www.edu.sot.tum.de LINK
-
PEER (Paper Evaluation and Empowerment Resource) wurde entwickelt um Schüler beim Verfassen von Aufsätzen zu unterstützen. Von der Grundschule bis zur Universität, von Erzählungen über Erörterungen bis hin zu Textanalysen - PEER gibt dir Tipps wie du deine Aufsätze noch besser machen kannst! Immer freundlich, immer hilfsbereit, immer geduldig.
-
- Text übersetzen:
-
www.deepl.com LINK
-
- Hörbeiträge erstellen (Texte sprechen):
-
elevenlabs.io LINK
-
ElevenLabs bietet die aktuell fortschrittlichste generative "Sprach-KI" auf dem Markt an. Zudem wird mittlerweile eine eigene App (ElevenReader) zum erstellen von Bulletins und Podcasts angeboten – aktuell ist die Nutzung der App nach Registrierung sogar kostenfrei möglich (Stand 20.02.2025).
-
Warum sollte ich Texte vertonen oder Hörbeiträge erstellen und in meinem Unterricht einsetzen?
-
…mehr dazu hier:
-
www.iqb.hu-berlin.de LINK
-
- wissenschaftliches Arbeiten:
-
elicit.com LINK
-
consensus.app LINK
-
-
…Perplexity Deep Research – ähnliche Systeme sind auch von OpenAI und Anthropic verfügbar – nutzen:
-
www.perplexity.ai LINK
-
Durch Kombination der Deep-Research-Funktion mit einem Reasoning-Modell wie Anthropic Claude 3.7 Sonnet oder OpenAI o3(-mini) kann neues, "synthetisches Wissen" generiert werden. Dieses unterscheidet sich maßgeblich von den Ergebnissen der GPT-Modelle, welche lediglich bekannte Daten auf Basis ihres neuronalen Netzes neu miteinander kombinieren (= Erzeugen von Remixes). – Mit dem genierten "synthetischem Wissen" können wiederum LLMs trainiert werden. Dies wird in nächster Zeit maßgeblich die Entwicklung der generativen ML-Systeme beschleunigen.
Bilder
-
- OpenAI DALL-E:
-
openai.com LINK
-
- Adobe Firefly:
-
firefly.adobe.com LINK
-
Interessant im Kontext Maker Education und für technische Ausbildungsberufe (z. B. Industrietechniker, technischer Zeichner, Dreher, etc.): Adobe bietet zahlungspflichtig für Abonennten ein Firefly-Modell an, das Vektorgrafiken erzeugen kann. Diese Grafiken lassen sich dann vielfältig mit der Laser-, Schneide-, Fräs- und Drucktechnik in unserem Medienzentrum weiterverarbeiten.
-
…ohne Registrierung begrenzt nutzbar:
-
- Stable Diffusion:
-
huggingface.co LINK
-
huggingface.co LINK
Video (Bewegtbild)
-
- OpenAI Sora:
-
openai.com LINK
-
- Adobe Firefly:
-
www.adobe.com LINK
-
Hilfestellungen zur Verwendung von Firefly:
-
Laut Eigenauskunft bemüht sich Adobe beim Training der Firefly-Modelle um die Wahrung des Urheberrechts:
"Um die kommerzielle Nutzung der mit Firefly generierten Inhalte zu ermöglichen, verwendet Adobe für das Training des Firefly-Videomodells lizenzierten Content, etwa von Adobe Stock, sowie gemeinfreie Inhalte, deren Urheberrechtsschutz abgelaufen ist. Content von Userinnen und Usern von Adobe wird nicht für das Training verwendet." -
Weiterhin besteht die Möglichkeit, Videos zu übersetzen und die Lippenbewegung an die neue Sprache anzugleichen:
-
-
Weitere generative Modelle zur Videoerzeugung finden Sie bei Replicate (siehe nächste Spalte rechts).
Audio (Musik)
-
- Suno:
-
suno.com LINK
-
- Udio:
-
www.udio.com LINK
-
Achtung: Es wurden mehrere gerichtliche Verfahren in Bezug auf Urheberrechtsverletzungen beim Training der Modelle hinter Suno & Co. eröffnet.
Weitere generative ML-Systeme in der Cloud
-
- Replicate – eine Plattform für Fortgeschrittene:
-
replicate.com LINK
-
Replicate bietet zahlreiche ML-Systeme für fortgeschrittene Nutzerinnen und Nutzer über einen leistungsfähigen Cloudservice an (Abrechnung nach Nutzung).
Nützliche KI-Apps & Plattformen für Lehrkräfte (beispielhafte Empfehlungen)
Plattformen speziell für den Einsatz in der Schule
-
Das Land Hessen wird in absehbarer Zeit ein AIS (adaptives intelligentes (Lern-)System), das generative Funktionen enthalten wird, zum Zwecke der Unterstützung bei der Individualisierung und Differenzierung der Lernwege bereitstellen. Einen konkreten Starttermin hat man bislang jedoch noch nicht kommuniziert. (Stand: 05.02.2025)
-
Basieren soll das kommende AIS des Landes Hessen auf einer Lösung, die derzeit vom FWU entwickelt wird:
-
fwu.de LINK
-
Update (10.05.2026): KI-Chat-Lösung des FWU namens "ais-chat.schule":
-
ais-chat.schule LINK
- Die Verfügbarmachung soll per Kachel im hessischen Schulportal der jeweiligen Schule(n) per VIDIS geschehen. Der Funktionsumfang wird länderspezifisch angepasst werden.
-
-
Die bekannten Schulbuchverlage bieten inzwischen eine Vielzahl an KI-Tools für Lehrkräfte und Schüler/innen an.
-
Darüber hinaus gibt es Angebote von zahlreichen neuen Anbietern, die sich gezielt auf die Verwendung von KI im Schulkontext spezialisiert haben. Bekannt sind u. a. fobizz, to teach_, schulKI, fiete.ai/fellowfish und Articlett.Schule (Liste nicht abschließend).
-
Wichtig: Es gibt derzeit keine(!) flächendeckende Bereitstellung derartiger Angebote – auch nicht über das örtliche Medienzentrum. Die Beschaffung ist schulspezifisch zu klären und aus eigenen Mitteln vorzunehmen (je nach Paketumfang aus LMF-Mitteln und/oder Fachschafts- und/oder Fortbildungsbudgets).
Nützliche Apps für den Lehreralltag
-
- Canva (alle Plattformen und browserbasiert):
-
www.canva.com LINK
-
…kostenlos für Lehrkräfte und Lernende:
-
www.canva.com LINK
-
- Obsidian (alle Plattformen):
-
obsidian.md LINK
-
Obsidian ist eine umfangreiche Notizen-App mit weitreichenden Funktionen bis hin zur Integration von LLMs (online und offline).
-
- Pal Chat (iPadOS und iOS):
-
apps.apple.com LINK
-
Pal Chat ist eine in der Basisversion kostenfreie Client-App für iPadOS/iOS. Sie ermöglicht den schnellen Wechsel zwischen verschiedenen LLMs. Das gewählte LLM kann sogar während des laufenden Chats gewechselt und der bisherige Chatinhalt übertragen werden.
Die Abrechnung nach tatsächlicher Nutzung über den eigenen Entwickleraccount – diesen kann prinzipiell jede Person bei einem der Anbeiter von LLMs problemlos beantragen. Die App bietet eine lokale Chat-Archivierung für eine minimierte Datenerfassung und -speicherung bei den Anbietern. Vorlagen für häufig gebrauchte Prompts können hinterlegt werden. -
Für Experten: Es können sogar eigens trainierte Sprachmodelle eingebunden werden.
-
Einsatz in der Schule:
Installation der Client-App auf Schul-iPads möglich, Verteilen eines(!) aktiven Nutzerschlüssels zu Beginn der Arbeitsphase, Deaktivieren des Schlüssels nach Ende der Arbeitsphase (d. h. nachfolgend keine kostenpflichtige Nutzung mehr möglich) – Vorteil: Lernende müssen keine eigenen Nutzerkonten besitzen und die eingegebenen Daten werden laut Aussage der LLM-Diensteanbieter nicht zu Trainingszwecken verwendet und nach 30 Tagen von den Servern gelöscht. -
- Msty (macOS, Windows und Linux):
-
msty.app LINK
-
Msty ermöglicht die bequeme Nutzung verschiedener Online- und Offline-LLMs mit zahlreichen Personalisierungsoptionen. Die App ist sehr umfangreich und daher nur für macOS, Windows und Linux, nicht aber für das iPad erhältlich.
-
- Aiko (iPadOS):
-
apps.apple.com LINK
-
Aiko ermöglicht die lokale (on-device) Audio- und Videotranskription auf dem iPad - kostenlos.
-
- MacWhisper Pro (macOS):
-
MacWhisper Pro ist kostenpflichtig, aber eine für Lehrkräfte sehr nützliche App. Sie ermöglicht die lokale (on-device) Transkription von offline- und online-verfügbaren Audio- und Videomedien. Zudem kann man wiederkehrende Arbeitsschritte hinterlegen und mithilfe der Integration diverser LLMs automatisiert KI-basierte Arbeitsmaterialien zu Audio- und Videomedien erstellen.
-
- Voices (macOS):
-
Voices ist eine Client-App zur Generierung von Sprache (Audio). Sie erlaubt die Einbindung unterschiedlicher Anbieter über den eigenen Entwickleraccount (vgl. Pal Chat).
-
- NotebookLM (browserbasiert):
-
notebooklm.google LINK
-
Besonders interessant: Mit der Funktion „Audio-Zusammenfassung“ können Sie Ihre Textquellen mit nur einem Klick in gesprochene Diskussionen in einem podcastähnlichen Format verwandeln. – Außerdem verfügt das Tool über eine interaktive Mind-Map-Funktion.
-
…alternativ die Reader-App von ElevenLabs mit GenFM-Podcastfunktion:
-
elevenlabs.io LINK
-
- Sogni (macOS/iPadOS/iOS und browserbasiert):
-
www.sogni.ai LINK
-
Mit Sogni ist es möglich, Bilder on-device, also auf dem genutzten Endgerät selbst, zu erzeugen. Dabei gelangen keine Daten in Cloud-Services.
NEU: Edumaps KI (OpenAI GPT)
-
he.edumaps.de LINK
-
In der nachfolgenden Map findet sich eine umfassende Anleitung:
-
he.edumaps.de LINK
Blick in die Zukunft...
Multimodale GPTs als individuelle Lernhelfer und Assistenten
-
- OpenAIs GPT-4o* ist erst der Anfang…
-
Multimodale GPTs sind in der Lage, Text-, Audio- und Bild-/Bewegtbildeingaben gemeinsam zu verarbeiten und entsprechende Ausgaben zu generieren. Im Bildungskontext lässt sich dies z. B. in den Feldern Sprachlernen und MINT nutzen, grundsätzlich aber in jedem Kontext. Hier könnten multimodale GPTs – vorausgesetzt die Antwortqualität ist qualitativ gut und die Lehrkraft kann bestenfalls Einfluss auf das Antwortverhalten des Systems nehmen* – die Differenzierung und Individualisierung des Lernens massiv vorantreiben.
-
Weitere Informationen zu OpenAI GPT-4o auf der Seite des Entwicklers:
-
openai.com LINK
-
Wichtig: Die Verantwortung für den Lernprozess wird nach wie vor bei der Lehrkraft sowie den Lernenden selbst und nicht bei "der KI" liegen!
-
* Das demonstrierte generative ML-System ist seit 31.01.2025 für Endnutzer/innen in Europa verfügbar.
Bewegtbild-GPTs (Video generieren)
- –> zur Übersichtsbox "Video generieren (Bewegtbild)"
-
In einer zukünftigen Iteration und integriert in ein multimodales GPT-System könnten mithilfe von "Video-KI" individuelle Lernvideos generiert werden, in denen fachliche Inhalte an die individuellen Bedürfnissen der Lernenden angepasst und audiovisuell aufbereitet vermittelt werden.
-
- Synthesia lässt es "menscheln":
-
www.synthesia.io LINK
-
…aber auch missbrauchen:
Computersteuerung per Prompt
-
Per Text- bzw. Sprachprompt komplexe Aufgaben am Computer von "der KI" erledigen lassen – das ist schon jetzt in Grundzügen möglich:
-
www.anthropic.com LINK
-
We’re also introducing a groundbreaking new capability in public beta: computer use. Available today on the API, developers can direct Claude to use computers the way people do—by looking at a screen, moving a cursor, clicking buttons, and typing text.
-
-
Auch OpenAI bietet mit dem Operator (seit 12.03.2025 in Europa verfügbar) ein ML-System mit der Fähigkeit zu computer use:
-
openai.com LINK
Physical AI - KI im Alltag & Robotik
-
ML-Systeme für den Einsatz in komplexen Aufgabenfelder wie z. B. in der Robotik, werden auf höchst effiziente Weise in einer virtuellen Welt trainiert, um anschließend in bereits optimierter Ausformung Aufgaben in der realen Welt zu übernehmen.
-
blogs.nvidia.com LINK
-
"The next frontier of AI is physical AI. Physical AI models can understand instructions and perceive, interact and perform complex actions in the real world to power autonomous machines like robots and self-driving cars."
-
Mehr zu NVIDIA Cosmos und Omniverse hier:
-
www.nvidia.com LINK
-
…und im Video:
Weiterführende Materialien
Weitere Edumaps des Medienzentrums
-
Nachfolgend finden Sie weitere Materialien mit allgemeinen und vertiefenden Informationen:
-
- Materialsammlung "ChatGPT & Co.: Einsatz generativer KI-Systeme in der Schule":
-
he.edumaps.de LINK
Selbstlernkurse im Schulportal Hessen
-
- ChatGPT:
-
- Generative Bild-KI:
-
- Datenschutz: