Genau wie es mordsfilm schreibt. Danke!
Und dann gingen die Diskussionen wieder los: "Wer ist das Goldohr? Wer hat es rekrutiert?" usw.
Sie sind in Begriff, Heimkinoverein zu verlassen, um auf die folgende Adresse weitergeleitet zu werden:
Bitte beachten Sie, dass wir für den Inhalt der Zielseite nicht verantwortlich sind und unsere Datenschutzbestimmungen dort keine Anwendung finden.
Genau wie es mordsfilm schreibt. Danke!
Und dann gingen die Diskussionen wieder los: "Wer ist das Goldohr? Wer hat es rekrutiert?" usw.
Achwas.
Wie heißt es so schön in "Dark Star" bei der Diskussion zwischen Bombe 20 und Doolittle?
"Wenn Zusammenhänge logisch sind, dann sind sie es unabhängig von ihrem Ursprung."
Und ein hohe Zahl an Wiederholungen braucht es sehr wohl, um Zufall auszuschließen.
Da die Beschreibung von Tuning-Befürwortern oft sehr drastisch ausfallen ("da liegen Welten dazwischen!"), sollte eigentlich schon eine kleine Anzahl von max. 10 Durchläufen ausreichen. Unter der Annahme, dass für den Probanden da tatsächlich Welten dazwischen liegen, sollte man eine Trefferquote von 100% erwarten können. Umgekehrt wäre es schon großer Zufall, wenn er 100% richtig raten würde.
Die Frage ist also: Ist jemand, der überzeugt ist, Unterschiede zu hören, beim Test anwesend? Dann wäre der Nachweis "ja/nein" ja recht einfach.
Ist so jemand NICHT anwesend, könnte maximal nachgewiesen werden, dass ein Unterschied hörbar ist, wenn tatsächlich ein unbedarfter Teilnehmer nahezu 100% richtig zuordnet.
Das Gegenteil kann dann unter dieser Voraussetzung allerdings nicht nachgewiesen werden, da dann wohl schlicht und einfach kein "Goldohr" unter den Probanden dabei ist.
Dann kommt das Argument, dass der Test Stress verursacht und man damit schlechter hört.
Genaugenommen müsste von Tuning-Befürwortern eine konkrete Hypothese aufgestellt werden.
Wie: Wir sagen in 70% der Fälle kann ein Unterschied gehört werden mit einer Signifikanz von 95%.
Daraus leitet sich dann quasi der Rest ab (Stichprobengröße etc.).
Und nach dem Test steht oder fällt die Hypothese.
Dann kommt das Argument, dass der Test Stress verursacht und man damit schlechter hört.
Tatsächlich kam dieses Argument schon proaktiv weiter vorne.
Ich sehe das so: Wenn der Test nachweisen kann, dass es signifikant hörbare Unterschiede gibt (und sei es nur bei einem Teilnehmer), dann ist bei dem Test schon was rausgekommen.
Das versuchte ich zu vermitteln.
Eine Trefferquote deutlich außerhalb des Zufallsbereichs durch EINEN einzelnen Menschen beweist maximal, dass dieser EINE Mensch dazu in der Lage ist, bei diesen beiden Geräten einen Unterschied zu hören....
Und damit ist auch der Beweis erbracht, dass diese beiden Geräte auch unterschiedlichen Schall abgeben.
War bzw. ist das nicht die Ausgangsfrage?
Wie viele Stichproben man "braucht" ergibt sich aus den verschiedenen Anforderungen an den Test und ist eben nicht ein allgemein gültiger/nutzbarer Wert - es gibt daher auch (bis auf Extremwerte) kein richtig oder falsch.
Über die Anforderungen selbst darf/soll man freilich diskutieren.
... sollte eigentlich schon eine kleine Anzahl von max. 10 Durchläufen ausreichen. Unter der Annahme, dass für den Probanden da tatsächlich Welten dazwischen liegen, sollte man eine Trefferquote von 100% erwarten können. Umgekehrt wäre es schon großer Zufall, wenn er 100% richtig raten würde....
Das sind genau die Punkte die man sich vorher überlegen kann/soll, aber auch ausrechnen kann.
Wie viele von z.B. 10 müssen richtig sein, damit die Wahrscheinlichkeit durch Zufall auf das selbe Ergebnis zu kommen nur mehr 5% ist.
Wie viele von 20, damit sie 1% ist,....
Wie gesagt ich bin in dem Fall, weil es ja um nicht lebensbedrohliches geht, eher am unteren Ende zufrieden, was den Aufwand auch deutlich reduziert.
Aber ich kann auch verstehen, dass man es genauer will.
Im konkreten Fall gibt es sowieso Limits von außen (Zeit, Teilnehmeranzahl,...), was aber nicht heißt dass man es gleich bleiben lassen soll, sondern man kann ja daraus versuchen das beste zu machen, was in diesem Rahmen möglich ist.
mfg
Uff, Leute, trefft Euch doch einfach und hört Euch das Ding mal an.
Ich sehe das so: Wenn der Test nachweisen kann, dass es signifikant hörbare Unterschiede gibt (und sei es nur bei einem Teilnehmer), dann ist bei dem Test schon was rausgekommen.
Das sehe ich als primäres Ziel des Tests, nämlich erstmals den echten Nachweis zu haben, dass das Tuning überhaupt eine hörbare Veränderung bewirkt.
Das muss eben nicht zwingend für eine Mehrheit von Hörern, geschweige denn für alle gelten.
Ich gebe bei der Suche nach der empirischen Wahrheit auch mal zu bedenken, dass so HiFi Zeitschriften, nach denen abertausende Leute ihre Kaufentscheidungen treffen, auch keine 50 oder 100 Tester in ABX Tests die Geräte hören lassen. Wenn die richtigen drei zusammen sitzen, kann das ganz erfolgreich sein. Es sitzen ja auch keine 100 Tonmeister an einer Platte, da reicht der eine, der es halt drauf hat.
Die Kunst des Konsumenten ist es, sich selber in Relation zum überlieferten zu setzen um zu entscheiden, ob an der Überlieferung für ihn was dran ist, oder nicht. Das ist vermutlich auch der Grund, warum unter bestimmten Leuten Messwerte so beliebt sind: Sie trauen sich und/oder den anderen am Ende nicht (mehr).
Auf jeden Fall muss man die Möglichkeiten im Auge behalten und wenn ich es richtig lese, sind 50 Leute ABX aktuell halt nicht drin.
Am Ende kann man wohl vorgreifen, dass die Ergebnisse nur für Einzelpersonen relevant sein werden.
Selbst wenn 100% etwas hören sollten, würde das ja noch nicht aussagen, was wem davon besser gefallen hat.
Von daher muss sowieso jeder potentielle Käufer selber für sich testen
würde das ja noch nicht aussagen, was wem davon besser gefallen hat.
Darum kann es mMn sowieso nicht bei dem Test gehen, sondern nur, ob überhaupt Unterschiede hörbar sind und selbst dann heißt das noch lange nicht, dass jeder das kann. Wie groß sie dann ausfallen und ob besser, schlechter oder anders ist wieder was anderes und ganz zum Schluss kommt die Entscheidung was einem das (im positiven Fall) wert wäre.
Von daher muss sowieso jeder potentielle Käufer selber für sich testen
Leider wird so ein Blindvergleich für die meisten Käufer kaum durchführbar sein.
Naja, es wird ja seitens der überzeugten CM-Kunden nicht von Nuancen und Marginalien geredet, ein Diminuitiv wird selten bemüht..
Insofern müsste der Unterschied zwischen dem Big Mac von der Stange und dem von Tim Mälzer kreiierten Ultra-Mac auch trotz Ketchup und beengten Sitzverhältnissen noch mehr als eindeutig rauszuschmecken sein..
Das sehe ich ähnlich.
Denn es steht z. B geschrieben.:
Der Player spielt mit der Final Edition Modifikation nochmals präziser und detailreicher. Die Bild-Performance konnte ebenfalls nochmal gesteigert werden.
Es ist nicht die Rede davon, dass es zur Wahrnehmung der signifikanten Verbesserung speziell kalibrierter respektive mit Edelmetallauflagen modifizierter (oder diagnostizierter) Wahrnehmungsorgane bedarf.
Nicht einmal via Fußnote.
Perfekt.
Dann wird man auch mit sehr wenigen Teilnehmern sehr schnell signifikant.
Und da braucht es auch überhaupt keine Experten.
Wir machen einfach einen "Hausfrauentest". Wenn man das heute noch sagen darf.
Warum so negativ/polemisch?
Man kann natürlich Ansprüche an so einen Test so hoch setzen, sodass er praktisch für Hobby-Leute undurchführbar wird.
Es werden sich ein paar Leute wie hier beschrieben treffen und haben es gibt die Rahmenbedinugungen dazu.
Jetzt kann man sagen "könnts euch sparen, das wird nix - lernts Statistik", oder man überlegt sich, wie man innerhalb dieser Rahmenbedingungen das sinnvollste raus holen kann.
Was vielleicht heißt, dass man besser nur weniger/einfachere Fragen versucht zu beantworten, was heißt man gibt sich mit geringerem Signifikanzniveau zufrieden unsw...
mfg
Wir machen einfach einen "Hausfrauentest". Wenn man das heute noch sagen darf.
"Wohnsitzdienst und -versorgungsperson"
Und da braucht es auch überhaupt keine Experten.
Einen Nachweis, dass es überhaupt einen hörbaren Unterschied gibt, wird man so aber u.U. schuldig bleiben, denn bei negativem Ergebnis würde dann wieder das Holzohrenargument im Raum stehen und man wäre keinen Millimeter weiter als zuvor.
Bei der Teilnahme von Befürwortern des Tuning kann es zwar sein, dass dafür Wetten-dass-reife Fähigkeiten erbracht wurden, aber zumindest hätte man überhaupt mal die Wirksamkeit der Maßnahmen verifiziert.
Zitatvon Schauki: Warum so negativ/polemisch?
zumindest mein post war keinesfalls ablehnend oder negativ.
Im Gegenteil, ich würde annehmen, dass das BT-Ergebnis ja schon ziemlich klar ausfallen wird- sofern auch nur die Hälfte dessen stimmt, was überzeugte CM-Kunden so äussern.
Man sollte sich entscheiden: Entweder ein statistisch seriöser Test für eine definierte Zielgruppe, der für eben diese signfiikante Aussagen liefert.
Oder ein wohl strukturiertes Probehören von Enthusiasten, das aber gar nicht die Erwartungen des Ersteren erfüllen will bzw. kann.
Dazwischen ist es irgendwie Murks und Ansätze wie "mit einem ist es repräsentativ" sind dann das Ergebnis.
Sie haben noch kein Benutzerkonto auf unserer Seite? Registrieren Sie sich kostenlos und nehmen Sie an unserer Community teil!