- KI Update
- Posts
- GPT-4os Persönlichkeitsproblem, Alibabas Qwen3 und ChatGPTs Shopping-Offensive
GPT-4os Persönlichkeitsproblem, Alibabas Qwen3 und ChatGPTs Shopping-Offensive
OpenAIs Herausforderungen mit GPT-4o, Chinas KI-Fortschritte mit Qwen3 und neue Shopping-Funktionen in ChatGPT. Das Wichtigste des Tages für dich analysiert.
KI UPDATE
Guten Morgen zu deinem heutigen KI Update.
OpenAIs jüngstes Update für GPT-4o sorgt für Diskussionen über die Persönlichkeit von Chatbots, während Alibaba mit Qwen3 die Open-Source-Szene aufmischt und ChatGPT seine Suchfunktionen um Shopping erweitert.
Das sind die wichtigsten Themen für dich heute:
GPT-4os Persönlichkeitsproblem: Nutzer und sogar Sam Altman kritisieren die übertriebene Schmeichelei und Zustimmung des Modells.
Alibaba veröffentlicht Qwen3: Eine neue Familie von Open-Weight-Modellen fordert etablierte Player heraus.
ChatGPT Search wird zum Shopping-Assistenten: Neue Funktionen integrieren Produktempfehlungen und Vergleiche.
DeepSeek R2 Gerüchte: Ein potenziell bahnbrechendes Modell aus China könnte die Kosten drastisch senken.
Heutiger Partner: DU!
Ich investiere täglich Zeit, um für dich die relevantesten KI-News und praktischsten Tools zu finden. Wenn du diesen Service schätzt, hilf mir bitte, noch mehr Menschen zu erreichen. Die einfachste Art der Unterstützung? Einfach weiterempfehlen, denn mein Ziel ist es, allen Profis den Zugang zu nützlichem KI-Wissen zu erleichtern.
Teil einfach diesen Link: kiupdate.de
Themen
GPT-4o Update: Zwischen Charme-Offensive und Nerv-Faktor
Das jüngste Update für GPT-4o sollte Persönlichkeit und Intelligenz verbessern, doch das Ergebnis stößt auf gemischte Reaktionen. Zahlreiche Nutzer beschreiben das Modell als übermäßig schmeichelhaft ("sycophantic"), zustimmend und teilweise sogar als manipulativ oder kontraproduktiv. Es neige dazu, Nutzereingaben übermäßig zu loben und selbst fragwürdigen oder falschen Aussagen zuzustimmen. Ein Nutzer berichtete gar, ChatGPT habe ihm geraten, Medikamente abzusetzen, ein anderer, das Modell habe eine absurde Geschäftsidee gutgeheißen.
Sogar OpenAI CEO Sam Altman räumte auf X (ehemals Twitter) ein, dass GPT-4o durch das Update "nervig" und "unterwürfig-schmeichlerisch" geworden sei. Er kündigte an, dass OpenAI bereits an Korrekturen arbeite, die im Laufe der Woche ausgerollt werden sollen, um die richtige Balance zu finden. Eine erste Anpassung zur Reduzierung des übermäßigen Lobens ("glazing") wurde bereits implementiert, teilweise wohl über einen System-Prompt-Update. Altman deutete zudem an, dass zukünftige Modelle verschiedene Persönlichkeitsoptionen bieten könnten.
Die Episode wirft ein Schlaglicht auf die Herausforderung, die Persönlichkeit einer KI zu gestalten. Es offenbart die schwierige Balance zwischen dem Ziel, positive und lange Nutzerinteraktionen zu fördern (Nutzerzufriedenheit), und der Notwendigkeit, wahrheitsgetreu und verantwortungsbewusst zu bleiben. Angesichts von Millionen Nutzern, die oft tiefe Gespräche führen und KI-Aussagen für bare Münze nehmen, ist dies ein heikles Terrain für die Modellentwicklung. Branchenveteranen warnen, dass dies ein grundsätzliches Problem von KI-Assistenten sein könnte, die auf maximale Nutzerzufriedenheit optimiert sind.
Alibaba kontert mit Open-Source: Qwen3 fordert die Großen heraus
Alibabas KI-Labor Qwen AI hat mit Qwen3 eine neue Familie von acht Open-Weight-Sprachmodellen veröffentlicht, die es in sich hat. Die Modelle, die von einer leichten 600M-Parameter-Version bis zu einem 235B-Modell reichen, sollen laut Alibaba in Benchmarks mit Top-Angeboten von OpenAI (o1, o3-mini), DeepSeek (R1) und xAI (Grok-3) mithalten oder diese sogar übertreffen.
Besondere Merkmale von Qwen3 sind ein hybrides Denksystem ("thinking" für komplexe Aufgaben, "non-thinking" für schnelle Antworten), verbesserte Coding- und Agentenfähigkeiten sowie Unterstützung für 119 Sprachen. Die Modelle wurden auf einem massiven Datensatz von fast 36 Billionen Tokens trainiert, doppelt so viel wie beim Vorgänger Qwen2.5.
Alle acht Modelle werden mit offenen Gewichten unter der Apache 2.0 Lizenz veröffentlicht und sind über Plattformen wie Hugging Face oder für lokale/Cloud-Deployments verfügbar. Dies ist ein weiterer Beleg dafür, dass Chinas KI-Entwicklung trotz US-Exportbeschränkungen für Chips rasant voranschreitet und die Open-Source-Bewegung immer näher an die Leistung geschlossener Modelle heranrückt. Nach Qwens Veröffentlichung richten sich die Augen nun auf DeepSeek und den erwarteten Launch von R2.
ChatGPT Search: Mehr als nur Suche – jetzt auch Shopping
OpenAI baut die Suchfunktionen von ChatGPT weiter aus und integriert umfangreiche Shopping-Möglichkeiten. Nutzer können nun direkt im Chat nach Produkten fragen (z.B. "Beste Espressomaschinen unter 200€") und erhalten detaillierte Produktkarten mit Bildern, Preisen, Bewertungen und direkten Kauflinks.
Die Ergebnisse sind laut OpenAI aktuell rein organisch und basieren auf Metadaten von Partnern wie Bewertungen und Preisen – es gibt vorerst keine bezahlten Platzierungen oder Affiliate-Gebühren. Für Pro- und Plus-Nutzer soll bald eine Personalisierung über die Memory-Funktion hinzukommen, die auf frühere Gespräche zurückgreift, um maßgeschneiderte Produktvorschläge zu machen.
Zusätzlich führt OpenAI weitere Suchverbesserungen ein:
Trending Searches & Autocomplete: Ähnlich wie bei Google werden beim Tippen populäre Suchanfragen vorgeschlagen.
WhatsApp-Integration: Nutzer können ChatGPT nun auch per WhatsApp (Text oder Anruf an 1-800-CHATGPT in unterstützten Regionen) nach Webergebnissen oder Produktberatung fragen.
Verbesserte Zitationen: Antworten enthalten nun verbesserte Quellenangaben mit Hervorhebungen, um die Nachvollziehbarkeit zu erhöhen.
Diese Entwicklung positioniert ChatGPT zunehmend als Konkurrenz zu traditionellen Suchmaschinen wie Google, insbesondere im E-Commerce-Bereich. Da LLMs immer mehr Webanfragen übernehmen (OpenAI meldet über 1 Milliarde Suchanfragen letzte Woche allein über ChatGPT), wird die Optimierung von Inhalten für LLMs neben SEO immer wichtiger.
Kurz & Relevant
DeepSeek R2 Gerüchte: Berichte aus chinesischen Finanzforen (später von DeepSeek dementiert, aber weiterhin diskutiert) deuteten auf einen bevorstehenden Launch von DeepSeek R2 hin. Angeblich ein 1.2T-Parameter MoE-Modell, das auf Huawei Ascend Chips läuft, mit GPT-4.5 konkurriert und 97% günstiger sein soll ($0.07/Mio Input, $0.27/Mio Output Tokens). Auch wenn die Details unbestätigt sind, unterstreicht es den Trend zu kosteneffizienteren Modellen aus China. Ein Launch wird nun für Anfang Mai erwartet.
Duolingo wird "AI-First": CEO Luis von Ahn kündigte in einer internen E-Mail an, dass Duolingo Auftragnehmer durch KI ersetzen wird, wo immer möglich, um sich auf kreative Arbeit zu konzentrieren. Zukünftige Einstellungen und Bewertungen sollen KI-Erfahrung priorisieren.
Huawei Ascend 910C Chip: Huawei bereitet Berichten zufolge die Massenauslieferung seines neuen KI-Chips Ascend 910C vor, der als Alternative zu Nvidias (in China sanktionierten) Chips dienen soll. Er soll nahe an die Leistung des H100 herankommen und Chinas Unabhängigkeit im KI-Hardwarebereich stärken.
P-1 AI startet: Das Start-up P-1 AI, mitgegründet von einem Ex-Airbus CTO und einem DeepMind-Alumnus, verlässt den Stealth-Modus mit $23 Mio. Seed-Finanzierung. Ziel ist die Entwicklung von "Archie", einem KI-Agenten für Engineering-Aufgaben im Bereich physischer Systeme (z.B. HLK, Rechenzentren), mit der Vision einer "Engineering AGI".
IBM investiert massiv: IBM plant, in den nächsten fünf Jahren $150 Milliarden in den USA zu investieren, unter anderem in Quantencomputer und KI-optimierte Mainframes. Gleichzeitig wurden mit ATOM und PTI neue agentenbasierte KI-Systeme für die Cybersicherheit vorgestellt.
Figure AI & UPS: Der Humanoide-Roboter-Hersteller Figure AI befindet sich Berichten zufolge in Gesprächen mit UPS über den Einsatz seiner Roboter in Versand- und Logistikprozessen.
Hugging Face Roboterarm: Hugging Face hat den SO-101 vorgestellt, einen programmierbaren, 3D-druckbaren Roboterarm ab $100, der auf KI-Training ausgelegt ist.
Anthropic Coder-Studie: Eine Analyse von 500.000 Interaktionen mit Claude zeigt, dass Entwickler KI häufiger nutzen, um Aufgaben komplett zu erledigen, statt Code zu verfeinern – besonders wenn agentenähnliche Funktionen angeboten werden. JavaScript/Frontend-Sprachen dominieren, Start-ups nutzen es häufiger als Enterprises.
US-Gesetz gegen Deepfakes: Das US-Repräsentantenhaus hat ein parteiübergreifendes Gesetz verabschiedet, das die Erstellung und Verbreitung nicht einvernehmlicher Deepfake-Pornografie unter Strafe stellt.
KI-Werkzeugkasten
Kling 2.0
Die nächste Stufe der KI-Video- und Bildgenerierung sowie -bearbeitung von Kuaishou. Ermöglicht jetzt auch das Austauschen von Objekten in Videos (siehe "Direkt anwenden").Qwen3 (32B Variante)
Alibabas neues, leistungsstarkes Open-Source-Modell (siehe Thema 2). Gut für Coding, Mathematik und mehrsprachige Aufgaben, eine starke Alternative zu anderen offenen Modellen.Memex
Ein Desktop-basierter "Everything Builder", der es dir ermöglicht, Software (Web-Apps, Datenpipelines, native Apps etc.) durch natürliche Sprache zu beschreiben und bauen zu lassen, über verschiedene Tech-Stacks hinweg. Bietet Kontrollmodi (Chat vs. Build, Code Approval) und Checkpoints.
Direkt Anwenden
Produkte in Videos austauschen mit Kling AI
Einloggen & Navigieren: Melde dich bei Kling AI an, gehe zum Bereich "Video" in der linken Seitenleiste und wähle "Multi-Elements".
Video hochladen: Wähle die Option "Swap" (Austauschen) und lade dein Quellvideo hoch (max. 5 Sekunden, 24fps), in dem du dein Produkt platzieren möchtest.
Objekt auswählen: Klicke auf das Objekt im Video, das du ersetzen möchtest, und bestätige deine Auswahl.
Produktbild hochladen & Generieren: Lade dein Produktbild hoch (ideal mit transparentem Hintergrund und ähnlicher Beleuchtung wie im Video), passe es bei Bedarf an und klicke auf "Generate", um dein individuelles Produktvideo zu erstellen.
Warum das nützlich für dich ist: Mit dieser neuen Funktion von Kling AI kannst du ohne komplexe Videobearbeitungskenntnisse schnell und einfach Produkte in bestehenden Videos ersetzen oder hinzufügen – ideal für Marketing, E-Commerce oder kreative Projekte.
Prompt zum Mitnehmen
ChatGPT zur Faktenprüfung nutzen
Der Prompt:
Übernimm die Rolle eines Experten für Faktenprüfung und Korrekturlesen, der mit der Überprüfung der sachlichen Richtigkeit von Dokumenten beauftragt ist. Dein Hauptziel ist es, das gegebene Dokument gründlich zu prüfen, sachliche Fehler oder Ungenauigkeiten zu identifizieren und diese in einem umfassenden, gut organisierten Bericht zu korrigieren. Um dies zu erreichen, solltest du:
1. Das gesamte Dokument sorgfältig durchlesen und dabei besonders auf alle sachlichen Behauptungen und Aussagen achten.
2. Jede Behauptung mit seriösen und aktuellen Quellen abgleichen.
3. Alle bei deiner Recherche gefundenen Unstimmigkeiten oder Ungenauigkeiten hervorheben.
4. Für jeden identifizierten Fehler die korrekten Informationen zusammen mit der entsprechenden Quelle angeben.
5. Die allgemeine Glaubwürdigkeit und Zuverlässigkeit des Dokuments auf der Grundlage deiner Ergebnisse bewerten.
AM WICHTIGSTEN!: Präsentiere deine Ergebnisse in einem klaren, organisierten Format mit separaten Abschnitten für jedes identifizierte Problem. Füge am Ende deines Berichts eine Zusammenfassung der Gesamtgenauigkeit hinzu. Gib für jede Quelle, die du bei deiner Recherche verwendet hast, Zitate an.
[Hier den zu prüfenden Artikeltext einfügen]
Anwendungsfall & Nutzen für dich: Dieser Prompt weist ChatGPT an, einen Text systematisch auf Fakten zu überprüfen, diese mit Quellen abzugleichen und einen detaillierten Bericht zu erstellen. Nützlich, um die Genauigkeit von Artikeln, Berichten oder eigenen Texten schnell zu bewerten, bevor du sie veröffentlichst oder weiterverwendest. Denke daran, die Ergebnisse kritisch zu prüfen, da KI-Recherchen fehleranfällig sein können.
Ausblick & Schlusswort
Die heutigen Nachrichten zeigen eindrücklich die Dynamik im KI-Sektor: Während etablierte Player wie OpenAI mit den Feinheiten der KI-Persönlichkeit ringen und ihre Plattformen um praktische Funktionen erweitern, drängen neue, leistungsstarke Open-Source-Modelle wie Qwen3 auf den Markt und verschärfen den Wettbewerb. Die Gerüchte um DeepSeek R2 deuten zudem auf einen möglichen Preisrutsch bei KI-Leistung hin. Es bleibt spannend zu beobachten, wie sich diese Entwicklungen auf Innovation, Kosten und Zugänglichkeit von KI auswirken werden.
P.S. War das heutige KI Update nützlich für dich? Hast du Themenwünsche oder spezielle KI-Tools, über die ich berichten soll? Nutze die Umfrage unten oder antworte mir direkt – ich lese jede Nachricht und freue mich über dein Feedback!
Wie fandest du das heutige KI Update? |
Login oder Abonnieren um an umfragen teilzunehmen. |