• Wie aus den radioforen.de-Nutzungsbedingungen hervorgeht, darf kein urheberrechtlich geschütztes Material veröffentlicht werden. Zur Identifizierung von Interpret und Titel (o. ä.) dürfen jedoch Hörproben bis zu 30 Sekunden angehängt werden. Was darüber hinausgeht, können wir nicht tolerieren.

Musik (und anderes) von der KI

Dass man mit der Anwendung suno.ai Musikstückchen über alles nur erdenkliche schreiben kann, haben ich und einige Andere hier ja bereits letztes Jahr vorgeführt. Inzwischen hat sich die Anwendung aber deutlich verbessert und auch ihr Funktionsumfang ist wesentlich größer geworden. Beispielsweise kann man heute auch Songs von bis zu vier Minuten Länge generieren. Und wenn das nicht ausreicht, fordert man die KI einfach auf, den Song zu komplettieren.
Auch hat man nun die Möglichkeit, selbst Audiomaterial hochzuladen und kann dann der KI die Aufgabe geben, anhand dieser Versatzstücke ein neues Musikstück zu generieren. Die Sequenz, an der sie sich dabei orientieren soll, muss zwischen sechs und 60 Sekunden lang sein.
Und da hatte ich als Radiofan nun eine Idee: Was würde wohl passieren, wenn man der Anwendung ein altes Pausenzeichen (in diesem Fall das der Deutschen Welle) vorsetzt und sie bittet, darauf basierend ein neues Musikstück zu kriieren? Das Ergebnis finde ich so überraschend gut gelungen, dass ich es Euch nicht vorenthalten will.
 

Anhänge

Zuletzt bearbeitet:
Was ist das? Ganz einfach, ein Musikstück, das ich gestern mit künstlicher Intelligenz erstellt habe. Es soll den Sound der 70er-Jahre-Schlager nachahmen und klingt schon deswegen stark nach Cindy & Bert, Nina & Mike, Adam & Eve etc. Mangels genauer Präzisierung der Promts konnte sich das Programm aber nicht zwischen deutschem und niederländischem Liedtext entscheiden. Im Falle professioneller Musikerzeugung kann man die Lyrics natürlich fest vorgeben, dann weiß die KI selbst um welche Sprache es sich handelt und der Kauderwelsch dieses Musikbeispiels bleibt einem erspart.

Wie man unschwer erkennen kann ist die Software beim Erfinden gelungener Melodien und gewinnender Arrangements den meisten Komponisten haushoch überlegen, außerdem lassen sich die Titel auch rein instrumental erstellen, sodass sich die (Autotune-geschönten) Stimmen problemlos dazumixen lassen.

Schlagerbranche erwache und wirf die Synthesizer auf die Müllkippe!

Interessant wäre, was bei Dir herauskäme, wenn Du statt eines quasi 70er-Jahre-Schlagers einen Helene-Fischer-Andrea-Berg-Schlager generieren ließest, wahlweise auch Roland-Kaiser-Howard-Carpendale. :D
 
Noch eine kleine Demonstration: Ihr wisst ja dass ich schon länger mit verschiedenen Genre-Prompts experimentiere. Diesen traditionellen Country-Song habe ich unter Abwandlung eines bereits bestehenden Prompts mit KI in einer Viertelstunde zusammengeschustert ohne ihn weiter zu editieren. An Schlager nach dem Vorbild von Udo Jürgens muss ich mich erst noch versuchen, das erfordert einiges an Experimentierfreude.

 
@ricochet: Das hört sich professionell an. Die KI Country-Musik passt gut in amerikanische Fitness-Studios. Bei mir in Rotenburg (Wümme) im Clever-Fit und bei McFit in Bremen laufen die Songs von CD oder vom PC. Die Interpreten kenne ich nicht und kann auch nicht zwischen Original und KI generiert unterscheiden. Die Musik ist derart eintönig daß sich Produzenten nicht wundern sollten das es eine KI besser und melodischer kann. Nun bin ich mit Deep Purple sozialisiert worden und "Old School" Rockmusik Fan. Bin gespannt wann die KI da angreift.
 
Ja, es ist schon einige Zeit her, wann ich mich damit beschäftigt hatte. Aber mit Midi und Notensatz geht es auch. Ich wage zu bezweifeln, dass KI die harmonischen und satzmäßigen Zusammenhänge genauso hinbekommt. Die Vorlage waren Volksmusikmelodien. Jedenfalls hat mich der "Dachs-Söhner" vor allzu groben Schnitzern bewahrt. Wie harmonisiere ich mittelalterliche Tonarten. Einfach Dur und Moll draufklatschen. Keineswegs. Wie moduliere ich von einer Tonart zur anderen. Einfach rücken? Nee.
Und mit besseren Samples zum Beispiel von Vienna Symphonic Library klänge es noch viel besser.
 

Anhänge

Zuletzt bearbeitet:
Ich glaube du lügst dir da in die Tasche. Geh doch mal die einschlägigen Threads auf Reddit durch, da geraten Komponisten und Musiker aus den Reihen der Musikindustrie reihenweise in Rage, weil sie ihre Felle davonschwimmen sehen. Die Nutzer sind begeistert, selbst professionelle Anwender verfallen in Ekstase, sofern sie von der neuen Technologie nicht existenziell bedroht sind und von ihren "Segnungen" profitieren können. Arrangeure und Live-Musiker sind hingerissen und holen sich aus der KI-Wundertüte Inspirationen oder lassen fertige Instrumentaltracks erstellen.

So was schüttelt Udio auf Basis einiger Sichworte ieinfach aus dem Ärmel:


Im Gegensatz zu Deutschland gibt es in den Staaten eine riesige professionelle Musikerszene, entsprechend groß ist die Aufregung. Welche kleine Produzenten-Klitsche, egal auf welchem Betätigungsfeld, kann schon ein komplettes Orchester engagieren? Jetzt ist das möglich, quasi für ein Trinkgeld.
 
Zuletzt bearbeitet:
Welche kleine Produzenten-Klitsche, egal auf welchem Betätigungsfeld, kann schon ein komplettes Orchester engagieren? Jetzt ist das möglich, quasi für ein Trinkgeld.
Der Beitrag stammt von 2005 mit freundlicher Genehmigung DLF.
Vienna Symphonic Library war da der Vorreiter, wovon heute KI abkupfert.
Aber mit Notensatz fängt man an und kann erst einmal herumexperimentieren damit. Mit einem Finger auf der Klaviertastatur und hinterher auf eine Zeile die weiteren Noten reinkopieren.
 

Anhänge

Was macht man, wenn man kein Klavier zu Hause hat? Man nimmt ein Notensatzprogramm. Und so fängt dann die "eigentliche" Kompositionsarbeit an. Der Rest ist Finetuning. Die Kärrnerarbeit kann einem keine KI abnehmen. Genausowenig, wie sie Gedanken lesen kann. Glücklicherweise!
 

Anhänge

Weiter geht's mit Musik, die auf Pausenzeichen basiert. Hier einmal eine Bigband-Variation über den Südwestfunk, die wohl fast Peter Herbolzheimer zu Ehre gereichen dürfte:
Anhang anzeigen Südwestfunk Baden-Baden.mp3 Und dann noch ein Remix der Ö3-Signation, bei dem man kaum vermuten würde, dass das ihm zugrundeliegende Original bereits fast 60 Jahre auf dem Buckel hat:
Anhang anzeigen Österreich 3.mp3
 
Ist natürlich einfach, wenn schon etwas da ist, auf das man zurückgreifen kann. Oben eben die Audiofiles von Intervall signals. Wenn jemand aber eine völlig neue Melodie erstellen möchte, wie machte er das? Mikrofonaufnahme mit Pfeifen oder Auf-dem-Kamm-Blasen? Und dann noch mehrstimmig-simultan. Am Notensatz führt m. M. n. da kein Weg daran vorbei. Und mit MIDI-Keyboard geht's schon mal einfacher, wenn auch hinterher meistens noch per Maus nacheditiert werden muss.
Apropos: Das MIDI-Stück oben erforderte etwa 20000 Mausbewegungen. Für so ein paar Minuten "Musik aus dem Computer" recht viel. Und dann noch mit grauenhaft verwaschenen Wav-table-Samples. Dass eine praktikablere Lösung her musste, zeichnete sich schon vor etwa 20 Jahren ab. Auch spielt die Entwicklung auf dem Computersektor eine Rolle. Bessere Chips, mehr Speicher, schnellere Zugriffszeiten, echter klingende Samples. Mittlerweile ist auch das öffentlich verfügbare Material gewaltig angewachsen.

Was die KI macht, ist nur ein Aufsatteln auf bereits Vorhandenes im Sinne von Stilmittel-Verwendung, bereits "Antrainiertem". Sie kann kombinieren, aber das Problem der Klangerzeugung und des Raumklanges wird nicht berührt. Das muss schon von anderen vorher gelöst worden sein, an dem man sich dann bedienen kann.
 
Zuletzt bearbeitet:
Vienna Symphonic Library war da der Vorreiter, wovon heute KI abkupfert.
Aber mit Notensatz fängt man an und kann erst einmal herumexperimentieren damit. Mit einem Finger auf der Klaviertastatur und hinterher auf eine Zeile die weiteren Noten reinkopieren.

Schön und gut. Aber du solltest wissen dass KI-Modelle nicht das Geringste mit klassischen Synthesizern zu tun haben, sondern Muster variieren, die sie aus Millionen fertiger Musikstücke, an denen sie trainiert wurden, extrahieren. Nur das Deep-Learning-Modell wurde von Menschen entwickelt, den wirklich bedeutsamen Prozess der Datenaufnahme und -analyse erledigt das Programm selbsttätig ohne menschliches Zutun. Der Mensch stellt nur den Datenkorpus bereit, also die fertigen, mit vielen Tags versehenen Musikstücke. Diese Attribute helfen später bei der Zuordnung von Genres, Stilrichtungen, Tempi und stimmlichen Charakteristika.

PC-Synthesizer auf Basis eingespielter akustischer Instrumente wie VSL wurden von Menschen programmiert und verfeinert, erreichten aber nie die Klangeigenschaften natürlicher Instrumente. Sample-Libraries sind professionelle Versatzstücke, die fachmännisch gehandhabt werden müssen und viel Arbeit bei der Erstellung von Musikstücken erfordern. Für die Komposition von Filmmusik oder als Hilfsmittel bei Studioproduktionen ist eine VSL-Suite ideal geeignet, denn der Sound ist zweifellos großartig und die Samples lassen sich wunderbar miteinander kombinieren. Dennoch hört man vor allem den Strings an, dass sie auf klassische Weise synthetisiert wurden. Eine synthetisch modulierte Originalaufnahme per Sampling ist der Spielweise eines Originalinstruments nicht ebenbürtig.

Mit "Deep Learning" gelang etwas, woran menschliche Programmierarbeit trotz jahrzehntelanger Anstrengungen immer scheiterte: Die Reproduktion komplexer menschlicher Fähigkeiten und die Neuerschaffung vollständiger Werke durch Erfassung von Mustern und beliebige Variation dieser Matrix zu neuen, täuschend echten Kreationen, die noch dazu natürlich klingen und aussehen - und das bei minimalem Input (Prompt bzw. Eingabeaufforderung in natürlicher Sprache). Die Künstliche Intelligenz bringt sich die erworbenen Fähigkeiten durch Datenanalyse, Mustererkennung und automatische Detektion von Fehlern mittels Korrekturinstanzen also selber bei - und optimiert sich ohne menschliche Mitarbeit in zunehmendem Maße selbst. Die Programmierer könnten nicht mal mehr den Quellcode dieser Systeme interpretieren, so sehr hat sich die Technologie bereits verselbstständigt.

Synthesizer sind Resultate menschlicher Entwicklungsarbeit und müssen von Profis fachgerecht eingesetzt werden, die KI hingegen entwickelt sich bis zur Perfektion selbst weiter, der Mensch definiert nur das Ausgangsmodell und stellt die Daten für den Lernprozess bereit. Übersetzungsmodelle etwa durchwühlen das gesamte Internet und unterliegen nur wenigen von Menschen vorgegebenen Restriktionen.
 
Zuletzt bearbeitet:
sondern Muster variieren, die sie aus Millionen fertiger Musikstücke, an denen sie trainiert wurden, extrahieren. Nur das Deep-Learning-Modell wurde von Menschen entwickelt, den wirklich bedeutsamen Prozess der Datenaufnahme und -analyse erledigt das Programm selbsttätig ohne menschliches Zutun. Der Mensch stellt nur den Datenkorpus bereit, also die fertigen, mit vielen Tags versehenen Musikstücke.


Also nichts wirklich schöpferisch Neues, sondern lediglich Kombination bereits vorhandenen Materials, das in der Permutation dann als "Neu" deklariert wird.
Und wenn noch nichts vorhanden ist, muss der Musiker nach wie vor zum Notensatzsystem oder Synthesizer greifen. Oder er spielt selber Geige und nimmt es auf.

Problem sehe ich nur in der Verwendung von Stücken, an deren Entstehungsprozess und Produktionskosten eine KI nicht beteiligt war, sondern einfach kopiert, und der "Kreator" selbst Rechte am so erstellten Elaborat reklamiert.
Praktisches Beispiel:
Das Upload-Filter bei Videoplattformen untersucht beim Hochladen bereits Material auf eventuelle Urheberrechtsverstöße.
Bei Youtube findet sich seit einiger Zeit sogar eine Schaltfläche mit folgenden Beschreibungen:
Eine echte Person sagt oder tut darin etwas, was sie nicht gesagt oder getan hat
Es enthält veränderte Aufnahmen eines realen Ereignisses oder Orts
Es enthält eine realistisch anmutende Szene, die nicht wirklich stattgefunden hat

Also eindeutige Reaktion auf KI-generierte Inhalte.
 
Zuletzt bearbeitet:
Alles Neue, Kreative beruht auf Vorhandenem. Jeder Erfinder kombiniert bereits existierende Bausteine zu etwas Neuartigem.

Nach meinen bisher gewonnenen Erkenntnissen stellt die KI alle Komponisten locker in den Schatten, zumal sie nicht nur faszinierende Melodien hervorbringt, sondern auch noch kunstvoll arrangiert und das fertige Produkt erstellt (z.B. Begleitmusik für Gesangsinterpreten). Und das am Fließband, ganz ohne Schaffenskrise.

Mir ist auch klar dass das einigen Berufsgruppen ganz und gar nicht gefällt, man kann die Technologie aber auch als Inspirationsquelle nutzen.
 
Zuletzt bearbeitet:
Nach meinen bisher gewonnenen Erkenntnissen stellt die KI alle Komponisten locker in den Schatten, zumal sie nicht nur faszinierende Melodien hervorbringt, sondern auch noch kunstvoll arrangiert und das fertige Produkt erstellt (z.B. Begleitmusik für Gesangsinterpreten). Und das am Fließband, ganz ohne Schaffenskrise.
Eigentlich nein, weil der Komponist in der Lage ist, einem etwas mundfertig zu bieten. Wenn ich merke, daß eine Passage noch ein wenig Feinschliff nach meinem Gusto benötigt, kann ich mit DAW oder Notationsprogramm schnell mal zur Stelle hinflitzen und Korrekturen anbringen oder punktgenau experimentieren, bei einer KI funktioniert das in dieser Form noch nicht.
Und im Augenblick gibt's unglaublich viele Sachen, die von der KI nicht sauber abgedeckt werden, weil einfach noch nicht genügend Daten vorliegen. Ich fand's ja schon manchmal interessant, was die einschlägigen Programme mir so präsentiert haben, als ich einen Calypso haben wollte ... oder ich hatte auch mal einen guten Text, der brauchte aber ein krummes Versmaß, um wirklich zu wirken - hat die KI auch nach über 30 Minuten einfach nur konsequent versaut und kam auch mit keinen guten Alternativ-Vorschlägen zurück.

Mir ist auch klar dass das einigen Berufsgruppen ganz und gar nicht gefällt, man kann die Technologie aber auch als Inspirationsquelle nutzen.
Ja, einigen Berufsgruppen gefällt das überhaupt nicht, gerade denjenigen, die beispielsweise Jingles oder Betten für verschiedene Anwendungen liefern.
Keine Ahnung, ob die auf Inspirationsquellen scharf sind.

Gruß
Skywise
 
Korrekt. Wenn man ganz konkrete Vorstellungen hat wird man (noch) nicht bedient. Aber der Endabnehmer ist ja kein Komponist sondern lässt sich fertige Konzepte vorlegen, aus denen er auswählt. Das kann die KI schon heute leisten, und zwar mit Bravour. Sie präsentiert nicht nur eine vage Idee sondern wirft gleich fertige Musikstücke aus.

Wie die Branche damit umgeht können wir alle noch nicht abschätzen. Sicher ist jedoch dass der Markt völlig umgekrempelt wird.
 
Zurück
Oben