"We are back" « oc.at

KI, die pdf Files interpretiert und zusammenfasst

grOOvekill@ 26.03.2025 - 13:42 1448 26
Posts

grOOvekill@

Legend
Vienna Badass
Avatar
Registered: Nov 2001
Location: @home
Posts: 2314
S'Gott!

Ich arbeite seit zwei Jahren für ein Artist Catering Unternehmen. Wir versorgen hier alle möglichen nationalen und internationalen Bands kulinarisch in unterschiedlichen Locations (Arena, Gasometer, Stadthalle, Simm City, usw.)

Das Coole ist, dass ich hier mittlerweile schon einige Stars persönlich kennengelernt habe (Corey Taylor, Wu-Tang Clan, Die Antwoord, uvm), aber der Job selber ist teilweise halt schon zaach.

Ein Teil des Jobs ist es, zum Beispiel, die sogenannten Rider der Bands durchzusehen, um in weiterer Folge alles Notwendige zu besorgen. Rider sind in der Regel PDF Files, wo die Bands oder deren Management ihre Wünsche deponieren. Also das klassische "Nach der Show bitte 15 Flaschen Jack Daniels, 2kg Koks und ein paar Kondome" :D

Um nun endlich zum Punkt zu kommen: ich bräuchte eine KI, wo ich ein PDF hochladen kann und danach eine brauchbare Liste mit Items ausgespuckt bekomme, die es mir leicht macht, eine Einkaufsliste zu schreiben. Gleichzeitig sollten auch etwaige Unverträglichkeiten bei den Speisen oder die Anzahl von Veganern, Vegetariern oder spezielle Wünsche bei den Speisen genannt werden.

Ich brauche also eine KI, welche die Texte so gut wie möglich und vor allem so fehlerfrei wie möglich interpretiert, zusammenfasst und ausspielt.

Habt. ihr vielleicht Tipps, welche sich dafür gut eigenen könnten? Die schiere Anzahl an Apps/Tools macht es mir unmöglich, alle zu testen, ein Schubs in die richtige Richtung wäre hier extrem hilfreich.

Wer mir hilft, hier was Brauchbares zu finden, den schleuse ich ins nächste Konzert seiner Wahl in der Arena, im Gasometer oder von mir aus in der Stadthalle! :D

tia

liltan0x

Little Overclocker
Registered: Jul 2024
Location: void
Posts: 100
Ganz banal schon mal mit nem schönen Prompt an Instruktionen und dann mit ChatGPT probiert (sofern du mit den potenziellen rechtlichen Implikationen lebens kannst sofern du diese PDFs dort hochlädts) wie dieser Tasks dann ausgeht?

Oft sind PDFs auch für KIs aufgrund des Formats schon nicht lesbar (weil zB Bilder), aber hier kann man von Text ausgehen?

Und danke für den Einblick hinter die Kullissen der Stars. Rider :)

BiG_WEaSeL

Elder
-
Avatar
Registered: Jun 2000
Location: Wien
Posts: 8401
Ich hab ja keine Ahnung von ridern außer was man so hört, aber wenn da so Sachen drinnen stehen wie absichtlich versteckte Dinge nur damit sie wissen ob du es liest fände ich es gewagt sich auf KI einzulassen.

Können müsste es ChatGPT genauso. Wenn dir das aus Datenschutzgründen nicht gefällt dann z.B. ein lokales LLM mit dem Programm LMStudio laufen lassen. Wenn du willst kannst du ja mal einen anonymisierten rider zur Verfügung stellen und ich/wir schauen uns das an.

grOOvekill@

Legend
Vienna Badass
Avatar
Registered: Nov 2001
Location: @home
Posts: 2314
Also, ChatGPT habe ich schon ausprobiert, aber das Resultat war einigermaßen durchwachsen. Das Problem bei den Ridern ist, dass die alle unterschiedlich aussehen bzw. mit unterschiedlichen Tools generiert wurden. Manchmal tabellarisch, manchmal in einer Wurst, aber auf jeden Fall immer optisch unterschiedlich. Man will ja auch seine Band CI einfließen lassen.

Wenn ich bei 20 Ridern immer nachkontrollieren muss, dann bringt mir das Ganze nicht wirklich den gewünschten Effekt. Absichtlich Elemente verstecken, damit ich es schwer habe, kann ich mir nicht vorstellen. Die Dinger sind einfach alle wirklich sehr unterschiedlich. Von zwei banalen, weißen A4 Zetteln bis hin zu durchdesigntenKunstwerken ist da alles dabei.

Ich brauche einfach nur eine KI, welche mit allen Quelldateien gut umgehen kann und für genau diesen Zweck vielleicht besser funktioniert als andere.

grOOvekill@

Legend
Vienna Badass
Avatar
Registered: Nov 2001
Location: @home
Posts: 2314
Zitat aus einem Post von BiG_WEaSeL
...dann z.B. ein lokales LLM mit dem Programm LMStudio laufen lassen. Wenn du willst kannst du ja mal einen anonymisierten rider zur Verfügung stellen und ich/wir schauen uns das an.

Bitte, wo, bitte, wie, bitte was?! LLM? :D

Sorry, mir sagt das alles überhaupt nix. Ich kenne KI halt nur aus den Tools, die ich nutze oder eben online (CHatGPT, Grok).

Freue mich über etwas detaillierte Anweisungen!

Lord Wyrm

ex-topquote owner
Avatar
Registered: Jan 2005
Location: wean
Posts: 1358
Kann inhaltlich nichts beitragen würd aber gern Rider highlights hören :D

Dune

Dark mode
Registered: Jan 2002
Location: Wien
Posts: 10425
Ich werfe Mal NotebookLM in die Runde:
https://notebooklm.google.com/

Kannst dir einen chatbot mit ein paar Klicks zu deinen Dokumenten machen oder sie eben zusammenfassen lassen. Funktioniert überraschend gut.

grOOvekill@

Legend
Vienna Badass
Avatar
Registered: Nov 2001
Location: @home
Posts: 2314
Zitat aus einem Post von Lord Wyrm
Kann inhaltlich nichts beitragen würd aber gern Rider highlights hören :D

Also, aus dem Nähkästchen plaudern geht leider nicht, aber ich kann definitiv bestätigen, dass die Main Acts meist um Hausecken cooler sind als alle Support Acts, die meist so fetzendepperte Wünsche und große Egos haben, dass man sich schon wundern muss. :D

BiG_WEaSeL

Elder
-
Avatar
Registered: Jun 2000
Location: Wien
Posts: 8401
Zitat aus einem Post von grOOvekill@
Bitte, wo, bitte, wie, bitte was?! LLM? :D

Sorry, mir sagt das alles überhaupt nix. Ich kenne KI halt nur aus den Tools, die ich nutze oder eben online (CHatGPT, Grok).

Freue mich über etwas detaillierte Anweisungen!

LLM = Large Language Model
ChatGPT = Produkt von OpenAI das ihre hauseigenen LLMs (GPT 4, mini und wie sie alle heißen) einsetzt.
LMStudio = Ein Programm um lokal (bei entsprechender HW) "open source“ Sprachmodell laufen zu lassen.

Aber so wie du das schilderst hab ich es mir eh vorgestellt.

Viper780

Elder
Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 50684
Für die Main Acts ist es halt seit vielen Jahren ihr Hauptjob - aber ich glaub wir brauchen mal ein oc.at Treffen organisiert von einem Artist Catering Unternehmen ;)

NotebookLM wäre auch mein erster Ansatz. Ich lasse mir aber auch mit ChatGPT, Copilot, Gemini und anderen Text zusammenfassen und Listen generieren.

Leider kommt man um einen manuellen Abgleich bei komplexeren Dokumenten nicht herum

Dune

Dark mode
Registered: Jan 2002
Location: Wien
Posts: 10425
Zitat aus einem Post von Viper780
Leider kommt man um einen manuellen Abgleich bei komplexeren Dokumenten nicht herum

Ganz sicher nicht. Aber wenn man keinen Bock auf "Küchenserver" hat, und nicht wissen will, was LLMs sind, reicht's wahrscheinlich erst mal :)

grOOvekill@

Legend
Vienna Badass
Avatar
Registered: Nov 2001
Location: @home
Posts: 2314
Zitat aus einem Post von Viper780
Für die Main Acts ist es halt seit vielen Jahren ihr Hauptjob - aber ich glaub wir brauchen mal ein oc.at Treffen organisiert von einem Artist Catering Unternehmen ;)

Überhaupt kein Thema. Termin festsetzen, Leute einladen, Essen bestellen. Let's do this! :D

grOOvekill@

Legend
Vienna Badass
Avatar
Registered: Nov 2001
Location: @home
Posts: 2314
Zitat aus einem Post von Dune
Ganz sicher nicht. Aber wenn man keinen Bock auf "Küchenserver" hat, und nicht wissen will, was LLMs sind, reicht's wahrscheinlich erst mal :)

Ohne manuellen Abgleich geht's eh nicht, das ist mir klar, aber es wäre schon viel Arbeit getan, wenn man nicht jeden einzelnen Schmarrn auslesen müsste und eine solide Grundlage hätte, die man dann nur mehr abgleichen muss. In der Woche kommen da nämlich manchmal schon einige Shows zusammen und irgendwann ist das Hirn nur mehr komplett zugemüllt und dann inhaltlich noch was auf die Reihe kriegen spielt's eher weniger.

Dune

Dark mode
Registered: Jan 2002
Location: Wien
Posts: 10425
Spiel dich einfach mal rum damit, obs für dich passt!

Es hat ganz witzige Features wie "make a talk of my 10min document". Es ist nur Spielerei, kann aber ganz unterhaltsam sein, was da interpretiert wird. Wenn es wirklich um größere Dokumente geht, keine Ahnung, ein Quantenmechanik PDF mit 200 Seiten oder so.

Wennst selber was bauen willst, trau dich ruhig einen Thread machen. Es gibt hier sehr viele User die mit mid/low end hardware ihr eigenes LLM hosten. Da kann man gerade mit DeepSeek oder Ollama zB relativ gute Ergebnisse erzielen. Ist aber natürlich wesentlich komplexer am Anfang.

Vielleicht noch ein spannender Disclaimer für dich:
Wenn du hier bei Google, ChatGPT und Ko einen Dokumentenupload machst, schau vielleicht dass du die Daten anonymisierst. Das geht nämlich alles auf deren Server für Trainingsdaten, vereinfacht gesagt. Z.B. "Michael Jackson möchte 7x minderjährige, 3x Buben, 3x Mädchen, 1x Redhead" könnte schon für einen kleinen Skandal reichen ;)
Bearbeitet von Dune am 26.03.2025, 14:45

BiG_WEaSeL

Elder
-
Avatar
Registered: Jun 2000
Location: Wien
Posts: 8401
Ja, das wäre eine Sensation wenn er das vom Grab aus „bestellt“. ;)
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz