URL: https://www.overclockers.at/artificial-intelligence/ki-modelle-gpt-xlstm-stable-diffusion-etc_261430/page_16 - zur Vollversion wechseln!
Herst Bender
@Hansmaulwurf: aber ja, könnte man drüber streiten was genau jetzt mit probieren gemeint is. Theoretisch probierst nach jedem Trainingsbatch indemst auf dem validation set schaust wie gut das Netz generalisiert.
edit: is das jetz offtopic? Wohl eher schon.
ja, völlig, ich dachte ich rede mit meiner älteren Sister, sie kenn siggi
Ja, aber:Zitat aus einem Post von charminJa, aber einstellen tust du den hyperparameter net während des trainings.Du definierst vorm Training das Verhalten und dann läuft das. Selbes mir temperature annealing bei softmax.
Dropout Layer droppen zufällig inputs während einzelnen Traininsschritten. Wenn sich das als vorteilhaft erweist, dann wird das übernehmen, insofern _probiert_ das Modell während dem Training Konfigurationsänderungen an der Struktur des Netzes.Zitat aus einem Post von charminProbiert wird da nix, sondern Parameter angepasst die den Fehler verringern.
Nein, aber es gibt einen reinforcement learning process wo er anhand von sowas lernen kann, bzw. sogar trainiert wurde:Zitat aus einem Post von charminEdit: um was es mir geht: wenn irgendein Hansl im Netz Chat gpt nutzt und dem als input irgend ein Wissen gibt. Dann wird das nicht einfach so übernommen.
https://www.assemblyai.com/blog/how...actually-works/ZitatThe creators have used a combination of both Supervised Learning and Reinforcement Learning to fine-tune ChatGPT, but it is the Reinforcement Learning component specifically that makes ChatGPT unique. The creators use a particular technique called Reinforcement Learning from Human Feedback (RLHF), which uses human feedback in the training loop to minimize harmful, untruthful, and/or biased outputs.
Hach, endlich jemand mit dem ich hier drüber quatschen kann. Wollen wir an eigenen thread machen?
Über die Chatgpt details können wir gerne quatschen, aber bei den neuronalen Netzen bin ich nur seh oberflächlich informiert, da ist mein Input quasi eh schon aus
Ich bin auch nur gschaftler, keine Sorge. ich mach dann mal einen auf.
@ Charmin THX - schau ich grad..
naja was muss man dafür groß wissen, sieht man doch... aber die katze ist leider schon ausm sack.
Wir haben derzeit noch keine General MI/AI.. und darum gehts
Microsoft verdient sauviel Kohle mit ihrem neuen Produkt.
Apple und Musk: mimimimi.
Die sehr spezifischen Ansätze die wir momentan haben, sind noch Jahre(zehnte) von etwas wirklich gefährlichem entfernt. Man sollte nur anfangen drüber nachzudenken. Denke ich - als lesser Intelligence
Zitat aus einem Post von charminMicrosoft verdient sauviel Kohle mit ihrem neuen Produkt.
Apple und Musk: mimimimi.
Regulierung wird sowieso nicht funktionieren _> cos Militär
Zitat aus einem Post von VinciWozniak und Mostaque (CEO von Stability AI) haben ebenfalls unterzeichnet.
Ich persönlich bin aber trotzdem gegen jegliche Regulierung. Wenn wir uns selbst vernichten ham mas einfach verdient.
overclockers.at v4.thecommunity
© all rights reserved by overclockers.at 2000-2025