Tradestation User Group Germany (http://www.tradernet.org/wbb/index.php)
|- Posts aus dem alten Userforum (http://www.tradernet.org/wbb/board.php?boardid=15)
|-- Synthetische Daten (http://www.tradernet.org/wbb/threadid.php?boardid=15&threadid=609)


Geschrieben von _Stefan am 03.05.2001, 21:10:

  Synthetische Daten

hallo,

hat hier jemand ahnung über verschiedene modelle zu generierung von synthetischen daten. kann mir vielleicht jemand literaturhinweise geben. bisher kenne ich nur den teil im chande-buch.

vielen dank für eine antwort

tschüß
stefan


Geschrieben von _Uwe am 04.05.2001, 17:10:

  RE: Synthetische Daten

Hallo, stefan!

Leider kenne ich keine Literatur bezüglich der Datengenerierung und auch die von Dir angegebene Literatur (Das Große Buch der Trading-Konzepte?) ist mir fremd. Welche Einschätzung hast Du über die dortigen Angaben gewonnen? Das Thema interessiert mich auch, obwohl mir bisher auch eine Generierung von Daten über EXCEL ausreichend geholfen hat.

Zeile SpalteA SpalteB SpalteC SpalteD SpalteE SpalteF SpalteG
1max.%d35,14,9
2Datum OPEN HIGH LOW CLOSE VOLUME
3TT.MM.YY100f1()f2()f3()f4()
4TT.MM.YYf5()


_Zelle_fi()_Zellenfunktion
C3(hi) f1() =B3*(1+$C$1*ZUFALLSZAHL()/100)
D3(lo) f2() =B3*(1-$D$1*ZUFALLSZAHL()/100)
E3(cl) f3() =D3+(C3-D3)*ZUFALLSZAHL()
F3(Vo) f4() =GANZZAHL(ZUFALLSZAHL()*1000000)

B4(op) f5() =E3*(1+VORZEICHEN(0,5-ZUFALLSZAHL())*$B$1*ZUFALLSZAHL()/100)


Die Formeln in den Zellen sind über "Kopierziehen" auf die darunterliegenden Zellen der Spalten zu übertragen.

  1. In den Zellen B1, C1 und D1 werden die gewünschten maximalen prozentuellen Veränduerungen eingetragen, die eingenommenwerden kann.
  2. In Zelle B3 ist der Startwert für den Eröffnungskurs der Kursreihe einzugeben.
  3. Höchst- und Tiefstkurs werden vom Erföffnungskurs aufgrund zufälliger prozentueller Abweichungen in den Grenzen 0 bis Eingabe in Zelle(1,Spalte)
  4. Der Schlußkurs zufällig innerhalb der Range gewählt
  5. Die eröffnung des nächsten Tages wird als prozentuelle Abweichung zum Schlußkurs des Vortages berechnet.

Die Volumenzahl ist nicht in Bezug zu den Kursveränderung gesetzt, was die Eignung dieser Generierung zur Untersuchung volumenbasierte Indikationenmodellen ausschließt.

Gruß
Uwe


Geschrieben von _Uwe am 04.05.2001, 17:10:

  RE: Synthetische Daten / Chart nachgetragen

Mit beschriebenen Ansätzen erstellter Candlechart (500 Bars)
ZufallsChart


Geschrieben von _Thomas am 04.05.2001, 22:10:

  RE: Synthetische Daten

Hi !

Bei dieser Art der Generierung bitte ich sich aber bewußt zu sein, das sie die Realität nur sehr ungenügend widergeben.

Die Zufallszahl in Excel liefert eine gleichmäßige Verteilung der Zahlen über das Intervall, in der Realität der Börse ähnelt die Verteilung aber eher einer Gaußschen Glockenkurve ( sie wird nach außen deutlich flacher und hat ihr Maximum bei Null - d.h. extreme prozentuale Kursänderungen treten deutlich seltener auf als kleinere ) !

Leider kann ich dies nicht mit Grafiken unterlegen ,da ich mir noch kein Webspace eingerichtet habe.

Bis denne ...
Thomas
------------------------------------------------------------------------------
Markets can only understood backward, but they must be traded forward !
------------------------------------------------------------------------------


Geschrieben von _Uwe am 05.05.2001, 00:10:

  RE: Synthetische Daten

Danke, Thomas, für Deine wichtige Ergänzung.

Dafür auch das Bild zu Deinem Text:



Die Horizontalachse skaliert die normierte prozentualle Veränderung dar. Um den Mittelwert bei ca. 0,45, tretten mit einer "Bandbreite" (Standarsabweichung) von +/-0,16 die meisten Ereignisse ein.

Die (rote) Kurve ist nach der Gleichung geformt, wie sie auf jedem 10,-DM-Schein nachtulesen ist.

Gruß
Uwe


Geschrieben von _Bernd Kürbs am 05.05.2001, 10:10:

  RE: Synthetische Daten

Diese Art der Generierung von Daten liefert keine korrekten Ergebnisse. Die returns der Indizes und Aktien wie z.B. SP500 sind eben nicht normalverteilt, sondern leptocurtic mit fat tails. D. h. die Werte sind viel enger um ihren Mittelwert gruppiert als bei der Normalverteilung und weisen große Abweichungen mit deutlich höheren Wahrscheinlichkeiten auf als bei der Normalverteilung.

Darüberhinaus ist die Verteilung vom gewählten Zeitrahmen abhängig, tages- bis Monatswerte zeigen die genannten Eigenschaften, bei Übergang zu längeren Zeiten, spätestens ab jährlich, sind die returns in der Tat normalverteilt.

Ein Artikel dazu: "Large Stock Market Price Drawdowns are Outliers" von Anders Johansen and Didier Sornette, October 3 2000.

Bei Interesse kann ich dir gerne die entsprechende Darstellung für den SP500 zusenden.

Mit freundlichen Grüßen

Bernd Kürbs


Geschrieben von _Uwe am 05.05.2001, 16:10:

  RE: Synthetische Daten

Hallo, Bernd!

Es besteht natürlich Interesse an diesen theoretischen Überlegungen und daher Danke für Dein Angebot, was ich gerne annehmen möchte, wobei ich mir bewußt darüber bin, daß ich mich noch für die letzte Information von Dir (Stichwort Proxy Displays), aus Jan. 2001 bedanken muß.

Bezüglich der Ermittlung von synthetischen Kursdaten, werden aus meiner Sicht, solche Verfahren wohl niemals "korrekte" Ergebnisse liefern, was immer man auch darunter, im Zusammenhang mit zukünftigen Börsendaten verstehen möchte.

Mit den Mitteln die mir zur Verfügung stehen, sind meines Erachtens Daten, die sich aus "Zufälligkeit gezogenen" historischer Abweichungen ergeben genauso recht, wie diese Daten, aus einer ("getürkten") Zufallsreihe, da m.E. letztendlich versucht werden muß, Stimmungen aus den Chartbildern zu erfassen, wenn man nicht gerade als langfristiger Anleger agieren möchte. Diese "Stimmungsspiegel" fehlt in beiden Ansätzen für die generierten Datenreihen.

Der Satz, den Thomas seinem Beitrag angefügt hat (Markets can only understood backward, but they must be traded forward), läßt mich eher mein "Heil" in Mustererkennung suchen, wozu ich Indikatoren als Stimmungsbarometer mitbenutze.

Um nun dennoch einmal auf die Auswertung zurückzukommen, hier die Verteilung für die letzten 500 Tagesbars des S&P500-Indexes, nach den selben Auswertungsansätzen wie vor.



Maximaler Anstieg = 5,12%
Maximaler Rückgang = 6,94%
Range der Veränderungen 12,07% = 1

normierte prozentuelle Veränderungen:
Mittelwert: 0,5746
Standardabweichung: 0,1049

Auf Anhieb wird Deine Aussage bestätigt, daß die Standardabweichung geringer ist, als die, wie sie sich für "zufällig" ermittelten Veränderungen ergibt, die dort zwischen 0,13 und 0,20 liegt.

Die Wahl des Zeitfensters (hier die letzten 500 Handelstage) und die Zeitfensterlänge dürften diese statistischen Werte allerdings auch verändern.

Alles Gute
Uwe


Geschrieben von _Bernd Kürbs am 06.05.2001, 10:10:

  RE: Synthetische Daten

Hallo Uwe,

E-Mail ist unterwegs, irgendwann muss ich auch mal die eigene Home-page in Gang setzten, damit ich solche Sachen einfacher kommunizieren kann.

Wenn ich Marktdaten simulieren möchte, dann sollten die synthetischen Daten ja immer noch Marktdaten sein können, sprich mit diesen einige Eigenschaften gemeinsam haben z.B. Dichtefunktion, Autokorrelationen und zeitliche Abhängigkeit der Varianzen. Ansonsten macht es meines Erachtens keinen Sinn synthetische Daten zu verwenden.

Eine Möglichkeit ist in "Trading Rules and regime shifts in foreign exchange" von Blake LeBaron in "Advanced Trading Rules" beschrieben.

Die genannten Eigenschaften verändern sich, wie schon gesagt, mit dem Zeitfenster, d.h. mit dem Zeitraum über den ich die Returns messe und mit der Länge des Zeitabschnittes den ich betrachte. Das muss man den halt berücksichtigen.

Viel Spaß

Bernd Kürbs

P.S. Phasor displays nicht Proxy Displays....


Geschrieben von _Phil am 07.05.2001, 13:10:

  RE: Synthetische Daten

Hi!

Um das angesprochene Problem zu umgehen nehme ich einfach die alten Daten, kopiere sie in Excel, berechne daraus die prozentualen Tagesveränderungen. Daneben setze ich eine Spalte Zufallszahlen und sortiere die Tagesveränderung nach den Zufallszahlen. (um die Tagesveränderungen zu mischen)
Aus der neuen Abfolge der Tagesveränderungen konstruiere ich dann den neuen Zufallschart. DAmit habi ich m.E. alle Eigenschaften der originalen zeitreihe erhalten und doch einen neuen Chart erhalten

gruesse
phil


Geschrieben von _Stefan am 08.05.2001, 17:10:

  RE: Synthetische Daten

Hallo,

vielen Dank für die bisherigen Antworten und Literaturhinweise. Wie Bernd Kürbs, phil und uwe bemerkt haben, suche ich keine Zufallsdaten, sondern synthetische Daten, die an ursprünglichen Daten eines Wertpapiers angelehnt sind (z.B. S&P500). Die Methoden - sind wie erwähnt – fraglich. Denn bei einer reinen zufälligen Neuverteilung der Tagesrenditen verbleiben zwar Erwartungswert und Varianz gleich, doch geht der Marktcharakter (das eigentliche Trendverhalten verloren). Gehe ich noch näher an die Originaldaten heran (Autokorrelationen und zeitliche Abhängigkeit der Varianzen) habe ich ja fast wieder die originalen Daten. Hmm, ein sehr verzwicktes Problem. Mir scheint, als bieten synthetische Daten wenig verbesserte Testmöglichkeiten. Werde mir die genannte Literatur ansehen und hoffe auf eine adäquate Lösung.

Tschüß
stefan

Powered by: Burning Board 1.1.1 © 2001 by WoltLab