Registrierung Kalender FAQ & Boardregeln Suche Mitgliederliste Moderatoren und Administratoren Linkdatenbank Startseite
Tradestation User Group Germany » freie Foren » Posts aus dem alten Userforum » Synthetische Daten » Hallo Gast [registrieren|anmelden]
« Vorheriges Thema Nächstes Thema » Druckvorschau | An Freund senden | Thema zu Favoriten hinzufügen
Neues Thema erstellen Antwort erstellen
Autor
Beitrag
_Stefan
Administrator



Dabei seit: 12 2001
Herkunft: User altes Forum
Beiträge: 13

_Stefan ist offline
  Synthetische DatenAntwort mit Zitat Beitrag editieren/löschen Nach weiteren Beiträge von  suchen Diesen Beitrag einem Moderator melden        IP Adresse Zum Anfang der Seite springen

hallo,

hat hier jemand ahnung über verschiedene modelle zu generierung von synthetischen daten. kann mir vielleicht jemand literaturhinweise geben. bisher kenne ich nur den teil im chande-buch.

vielen dank für eine antwort

tschüß
stefan

03.05.2001, 21:10 Profil von Füge  deiner Freunde-Liste hinzu Email an _Stefan senden Homepage von _Stefan
_Uwe
Administrator



Dabei seit: 12 2001
Herkunft: User altes Forum
Beiträge: 313

_Uwe ist offline
  RE: Synthetische DatenAntwort mit Zitat Beitrag editieren/löschen Nach weiteren Beiträge von  suchen Diesen Beitrag einem Moderator melden        IP Adresse Zum Anfang der Seite springen

Hallo, stefan!

Leider kenne ich keine Literatur bezüglich der Datengenerierung und auch die von Dir angegebene Literatur (Das Große Buch der Trading-Konzepte?) ist mir fremd. Welche Einschätzung hast Du über die dortigen Angaben gewonnen? Das Thema interessiert mich auch, obwohl mir bisher auch eine Generierung von Daten über EXCEL ausreichend geholfen hat.

Zeile SpalteA SpalteB SpalteC SpalteD SpalteE SpalteF SpalteG
1max.%d35,14,9
2Datum OPEN HIGH LOW CLOSE VOLUME
3TT.MM.YY100f1()f2()f3()f4()
4TT.MM.YYf5()


_Zelle_fi()_Zellenfunktion
C3(hi) f1() =B3*(1+$C$1*ZUFALLSZAHL()/100)
D3(lo) f2() =B3*(1-$D$1*ZUFALLSZAHL()/100)
E3(cl) f3() =D3+(C3-D3)*ZUFALLSZAHL()
F3(Vo) f4() =GANZZAHL(ZUFALLSZAHL()*1000000)

B4(op) f5() =E3*(1+VORZEICHEN(0,5-ZUFALLSZAHL())*$B$1*ZUFALLSZAHL()/100)


Die Formeln in den Zellen sind über "Kopierziehen" auf die darunterliegenden Zellen der Spalten zu übertragen.

  1. In den Zellen B1, C1 und D1 werden die gewünschten maximalen prozentuellen Veränduerungen eingetragen, die eingenommenwerden kann.
  2. In Zelle B3 ist der Startwert für den Eröffnungskurs der Kursreihe einzugeben.
  3. Höchst- und Tiefstkurs werden vom Erföffnungskurs aufgrund zufälliger prozentueller Abweichungen in den Grenzen 0 bis Eingabe in Zelle(1,Spalte)
  4. Der Schlußkurs zufällig innerhalb der Range gewählt
  5. Die eröffnung des nächsten Tages wird als prozentuelle Abweichung zum Schlußkurs des Vortages berechnet.

Die Volumenzahl ist nicht in Bezug zu den Kursveränderung gesetzt, was die Eignung dieser Generierung zur Untersuchung volumenbasierte Indikationenmodellen ausschließt.

Gruß
Uwe

04.05.2001, 17:10 Profil von Füge  deiner Freunde-Liste hinzu Email an _Uwe senden Homepage von _Uwe
_Uwe
Administrator



Dabei seit: 12 2001
Herkunft: User altes Forum
Beiträge: 313

_Uwe ist offline
  RE: Synthetische Daten / Chart nachgetragenAntwort mit Zitat Beitrag editieren/löschen Nach weiteren Beiträge von  suchen Diesen Beitrag einem Moderator melden        IP Adresse Zum Anfang der Seite springen

Mit beschriebenen Ansätzen erstellter Candlechart (500 Bars)
ZufallsChart

04.05.2001, 17:10 Profil von Füge  deiner Freunde-Liste hinzu Email an _Uwe senden Homepage von _Uwe
_Thomas
Administrator



Dabei seit: 12 2001
Herkunft: User altes Forum
Beiträge: 53

_Thomas ist offline
  RE: Synthetische DatenAntwort mit Zitat Beitrag editieren/löschen Nach weiteren Beiträge von  suchen Diesen Beitrag einem Moderator melden        IP Adresse Zum Anfang der Seite springen

Hi !

Bei dieser Art der Generierung bitte ich sich aber bewußt zu sein, das sie die Realität nur sehr ungenügend widergeben.

Die Zufallszahl in Excel liefert eine gleichmäßige Verteilung der Zahlen über das Intervall, in der Realität der Börse ähnelt die Verteilung aber eher einer Gaußschen Glockenkurve ( sie wird nach außen deutlich flacher und hat ihr Maximum bei Null - d.h. extreme prozentuale Kursänderungen treten deutlich seltener auf als kleinere ) !

Leider kann ich dies nicht mit Grafiken unterlegen ,da ich mir noch kein Webspace eingerichtet habe.

Bis denne ...
Thomas
------------------------------------------------------------------------------
Markets can only understood backward, but they must be traded forward !
------------------------------------------------------------------------------

04.05.2001, 22:10 Profil von Füge  deiner Freunde-Liste hinzu Email an _Thomas senden Homepage von _Thomas
_Uwe
Administrator



Dabei seit: 12 2001
Herkunft: User altes Forum
Beiträge: 313

_Uwe ist offline
  RE: Synthetische DatenAntwort mit Zitat Beitrag editieren/löschen Nach weiteren Beiträge von  suchen Diesen Beitrag einem Moderator melden        IP Adresse Zum Anfang der Seite springen

Danke, Thomas, für Deine wichtige Ergänzung.

Dafür auch das Bild zu Deinem Text:



Die Horizontalachse skaliert die normierte prozentualle Veränderung dar. Um den Mittelwert bei ca. 0,45, tretten mit einer "Bandbreite" (Standarsabweichung) von +/-0,16 die meisten Ereignisse ein.

Die (rote) Kurve ist nach der Gleichung geformt, wie sie auf jedem 10,-DM-Schein nachtulesen ist.

Gruß
Uwe

05.05.2001, 00:10 Profil von Füge  deiner Freunde-Liste hinzu Email an _Uwe senden Homepage von _Uwe
_Bernd Kürbs
Administrator



Dabei seit: 12 2001
Herkunft: User altes Forum
Beiträge: 11

_Bernd Kürbs ist offline
  RE: Synthetische DatenAntwort mit Zitat Beitrag editieren/löschen Nach weiteren Beiträge von  suchen Diesen Beitrag einem Moderator melden        IP Adresse Zum Anfang der Seite springen

Diese Art der Generierung von Daten liefert keine korrekten Ergebnisse. Die returns der Indizes und Aktien wie z.B. SP500 sind eben nicht normalverteilt, sondern leptocurtic mit fat tails. D. h. die Werte sind viel enger um ihren Mittelwert gruppiert als bei der Normalverteilung und weisen große Abweichungen mit deutlich höheren Wahrscheinlichkeiten auf als bei der Normalverteilung.

Darüberhinaus ist die Verteilung vom gewählten Zeitrahmen abhängig, tages- bis Monatswerte zeigen die genannten Eigenschaften, bei Übergang zu längeren Zeiten, spätestens ab jährlich, sind die returns in der Tat normalverteilt.

Ein Artikel dazu: "Large Stock Market Price Drawdowns are Outliers" von Anders Johansen and Didier Sornette, October 3 2000.

Bei Interesse kann ich dir gerne die entsprechende Darstellung für den SP500 zusenden.

Mit freundlichen Grüßen

Bernd Kürbs

05.05.2001, 10:10 Profil von Füge  deiner Freunde-Liste hinzu Email an _Bernd Kürbs senden Homepage von _Bernd Kürbs
_Uwe
Administrator



Dabei seit: 12 2001
Herkunft: User altes Forum
Beiträge: 313

_Uwe ist offline
  RE: Synthetische DatenAntwort mit Zitat Beitrag editieren/löschen Nach weiteren Beiträge von  suchen Diesen Beitrag einem Moderator melden        IP Adresse Zum Anfang der Seite springen

Hallo, Bernd!

Es besteht natürlich Interesse an diesen theoretischen Überlegungen und daher Danke für Dein Angebot, was ich gerne annehmen möchte, wobei ich mir bewußt darüber bin, daß ich mich noch für die letzte Information von Dir (Stichwort Proxy Displays), aus Jan. 2001 bedanken muß.

Bezüglich der Ermittlung von synthetischen Kursdaten, werden aus meiner Sicht, solche Verfahren wohl niemals "korrekte" Ergebnisse liefern, was immer man auch darunter, im Zusammenhang mit zukünftigen Börsendaten verstehen möchte.

Mit den Mitteln die mir zur Verfügung stehen, sind meines Erachtens Daten, die sich aus "Zufälligkeit gezogenen" historischer Abweichungen ergeben genauso recht, wie diese Daten, aus einer ("getürkten") Zufallsreihe, da m.E. letztendlich versucht werden muß, Stimmungen aus den Chartbildern zu erfassen, wenn man nicht gerade als langfristiger Anleger agieren möchte. Diese "Stimmungsspiegel" fehlt in beiden Ansätzen für die generierten Datenreihen.

Der Satz, den Thomas seinem Beitrag angefügt hat (Markets can only understood backward, but they must be traded forward), läßt mich eher mein "Heil" in Mustererkennung suchen, wozu ich Indikatoren als Stimmungsbarometer mitbenutze.

Um nun dennoch einmal auf die Auswertung zurückzukommen, hier die Verteilung für die letzten 500 Tagesbars des S&P500-Indexes, nach den selben Auswertungsansätzen wie vor.



Maximaler Anstieg = 5,12%
Maximaler Rückgang = 6,94%
Range der Veränderungen 12,07% = 1

normierte prozentuelle Veränderungen:
Mittelwert: 0,5746
Standardabweichung: 0,1049

Auf Anhieb wird Deine Aussage bestätigt, daß die Standardabweichung geringer ist, als die, wie sie sich für "zufällig" ermittelten Veränderungen ergibt, die dort zwischen 0,13 und 0,20 liegt.

Die Wahl des Zeitfensters (hier die letzten 500 Handelstage) und die Zeitfensterlänge dürften diese statistischen Werte allerdings auch verändern.

Alles Gute
Uwe

05.05.2001, 16:10 Profil von Füge  deiner Freunde-Liste hinzu Email an _Uwe senden Homepage von _Uwe
_Bernd Kürbs
Administrator



Dabei seit: 12 2001
Herkunft: User altes Forum
Beiträge: 11

_Bernd Kürbs ist offline
  RE: Synthetische DatenAntwort mit Zitat Beitrag editieren/löschen Nach weiteren Beiträge von  suchen Diesen Beitrag einem Moderator melden        IP Adresse Zum Anfang der Seite springen

Hallo Uwe,

E-Mail ist unterwegs, irgendwann muss ich auch mal die eigene Home-page in Gang setzten, damit ich solche Sachen einfacher kommunizieren kann.

Wenn ich Marktdaten simulieren möchte, dann sollten die synthetischen Daten ja immer noch Marktdaten sein können, sprich mit diesen einige Eigenschaften gemeinsam haben z.B. Dichtefunktion, Autokorrelationen und zeitliche Abhängigkeit der Varianzen. Ansonsten macht es meines Erachtens keinen Sinn synthetische Daten zu verwenden.

Eine Möglichkeit ist in "Trading Rules and regime shifts in foreign exchange" von Blake LeBaron in "Advanced Trading Rules" beschrieben.

Die genannten Eigenschaften verändern sich, wie schon gesagt, mit dem Zeitfenster, d.h. mit dem Zeitraum über den ich die Returns messe und mit der Länge des Zeitabschnittes den ich betrachte. Das muss man den halt berücksichtigen.

Viel Spaß

Bernd Kürbs

P.S. Phasor displays nicht Proxy Displays....

06.05.2001, 10:10 Profil von Füge  deiner Freunde-Liste hinzu Email an _Bernd Kürbs senden Homepage von _Bernd Kürbs
_Phil
Administrator



Dabei seit: 12 2001
Herkunft: User altes Forum
Beiträge: 75

_Phil ist offline
  RE: Synthetische DatenAntwort mit Zitat Beitrag editieren/löschen Nach weiteren Beiträge von  suchen Diesen Beitrag einem Moderator melden        IP Adresse Zum Anfang der Seite springen

Hi!

Um das angesprochene Problem zu umgehen nehme ich einfach die alten Daten, kopiere sie in Excel, berechne daraus die prozentualen Tagesveränderungen. Daneben setze ich eine Spalte Zufallszahlen und sortiere die Tagesveränderung nach den Zufallszahlen. (um die Tagesveränderungen zu mischen)
Aus der neuen Abfolge der Tagesveränderungen konstruiere ich dann den neuen Zufallschart. DAmit habi ich m.E. alle Eigenschaften der originalen zeitreihe erhalten und doch einen neuen Chart erhalten

gruesse
phil

07.05.2001, 13:10 Profil von Füge  deiner Freunde-Liste hinzu Email an _Phil senden Homepage von _Phil
_Stefan
Administrator



Dabei seit: 12 2001
Herkunft: User altes Forum
Beiträge: 13

_Stefan ist offline
  RE: Synthetische DatenAntwort mit Zitat Beitrag editieren/löschen Nach weiteren Beiträge von  suchen Diesen Beitrag einem Moderator melden        IP Adresse Zum Anfang der Seite springen

Hallo,

vielen Dank für die bisherigen Antworten und Literaturhinweise. Wie Bernd Kürbs, phil und uwe bemerkt haben, suche ich keine Zufallsdaten, sondern synthetische Daten, die an ursprünglichen Daten eines Wertpapiers angelehnt sind (z.B. S&P500). Die Methoden - sind wie erwähnt – fraglich. Denn bei einer reinen zufälligen Neuverteilung der Tagesrenditen verbleiben zwar Erwartungswert und Varianz gleich, doch geht der Marktcharakter (das eigentliche Trendverhalten verloren). Gehe ich noch näher an die Originaldaten heran (Autokorrelationen und zeitliche Abhängigkeit der Varianzen) habe ich ja fast wieder die originalen Daten. Hmm, ein sehr verzwicktes Problem. Mir scheint, als bieten synthetische Daten wenig verbesserte Testmöglichkeiten. Werde mir die genannte Literatur ansehen und hoffe auf eine adäquate Lösung.

Tschüß
stefan

08.05.2001, 17:10 Profil von Füge  deiner Freunde-Liste hinzu Email an _Stefan senden Homepage von _Stefan
  « Vorheriges Thema Nächstes Thema »
Neues Thema erstellen Antwort erstellen
Gehe zu:

Powered by: Burning Board 1.1.1 © 2001 WoltLab GbR