Apple testar en bildredigerare med AI i ChatGPT-stil

Apple har lanserat en ny modell för artificiell intelligens (AI) för bildredigering som använder textkommandon, kallad MGIE – Multimodal Large Scale Language Model Guided Image Editing. Denna öppen källkodsmodell tillåter användare att använda naturligt språk för att specificera önskade redigeringar.

Apple testar en bildredigerare med AI i ChatGPT-stil

För de som har bråttom:

  • Apple har introducerat MGIE, en AI-baserad, öppen källkodsmodell för bildredigering som låter användare göra justeringar med textkommandon på naturligt språk.
  • Med MGIE kan användare ge specifika instruktioner, som att “göra himlen blåare”, och modellen översätter detta till faktiska redigeringsåtgärder.
  • MGIE är särskilt kapabel när det gäller att tolka ett brett spektrum av kommandon och utföra komplexa justeringar, från grundläggande redigeringar som beskärning och storleksändring till mer avancerade modifikationer som att ändra bakgrunder eller lägga till objekt.
  • Modellen kan också förbättra den övergripande bildkvaliteten genom att justera ljusstyrka, kontrast, skärpa och färgbalans samt göra riktade redigeringar till specifika områden eller objekt i bilden, vilket gör det möjligt att anpassa attribut som form, färg och textur.

Exempelvis kan en användare instruera “göra himlen blåare”, och MGIE tolkar detta som att “identifiera och välj himlen och öka sedan mättnaden i detta område med 20 %.” Enligt VentureBeat kan MGIE utföra ett imponerande utbud av redigeringar. Om modellen inte levererar det förväntade resultatet, kan användaren precisera sin begäran eller ångra effekten och ge en ny instruktion.

Apple AI Editor

MGIE hanterar vanliga Photoshop-stil redigeringar, såsom beskärning, storleksförändring, rotation, och lägga till filter. Modellen tillämpar även mer avancerade redigeringar som att ändra bakgrunden, lägga till eller ta bort objekt och kombinera bilder.

Dessutom kan modellen optimera den övergripande kvaliteten på en bild genom justeringar av ljusstyrka, kontrast, skärpa och färgbalans. MGIE applicerar även konstnärliga effekter som att skissa, måla och teckna serier.

Slutligen tillåter MGIE redigeringar av specifika regioner eller objekt i en bild – till exempel ansikten, ögon, hår, kläder och accessoarer. Modellen kan modifiera attributen för dessa områden eller objekt, såsom form, storlek, färg, textur och stil.

MGIE är för närvarande tillgänglig som en öppen källkodsmodell på Github. Det finns också en onlinedemo där användare kan ladda upp egna bilder och experimentera med dem.

Tester

9to5Mac har också testat Apples AI-bildredigerare. “En kort test visar att det definitivt är en tidig beta, men jag ser verkligen potentialen.”

Under testet var uppmaningen: “gör himlen något rödare”. MGIE tolkade detta som: “Gör himlen i bilden rödaktig snarare än blåaktig. Lägg en skugga på stadsbilden.” Ändringen var dock beskuren i redigeraren, av okänd anledning.

Även om testredigeringen inte är användbar eftersom demot endast stöder mycket lågupplöst output, belyste sajten hur AI:n exakt justerade reflektionen inuti en metallram för att matcha himlen.

Det är ännu inte känt när eller om Apple kommer att lägga till denna funktion i iPhone eftersom modellen ger mer polerade resultat. Men genomförandet skulle vara logiskt. Efter allt strävar företaget alltid efter att automatisera fotografering med AI, vilket gör allt så enkelt att använda som möjligt.