In meinen Augen nicht ganz so trivial. Man muss z.B. auch Zyklen erkennen, sonst zählt man Coins ggf. doppelt und dreifach.
Ich würde auch die geleakte Datenbank dazuziehen. Da hast du alle Deposits und Withrawals und kannst dann zuordnen, welche Transaktionen von/an Kunden gegangen sind. Damit kannst du einigermaßen die Grenzen abstecken, welche Adressen zu Gox gehören und welche nicht mehr.
Leider sind in den Daten keine Adressen oder TxIDs zu finden. Man müsste die Transaktionen anhand des Datums und Amounts abgleichen.
Du sprichst über die Daten aus der MtGox2014Leak.zip?
MD5: 90e78be95914f93030b04eaceb22b447
SHA1: 6bcf91965a1848cecfc9156fe5691d0f94680d8f
Ich hatte sie mir gestern aus einem Torrent gezogen, dann gesehen, dass "dewdeded" sie wohl auch hier abgelegt hat:
https://bitcointalksearch.org/topic/m.5610125
Also um diese Daten geht es?
Ich habe sie mir angesehen. Ist schon erschreckend, dass ich dort meinen Kontostand und meine Transaktionen finde. Allerdings auch ein Indiz dafür, dass die Daten trotz des mitgelieferten Trojaners valide sind. Die von Dir vorgeschlagene Zuordnung halte ich jedoch leider für nahezu unmöglich, da ich nicht denke, dass die Zeiten in der Datei btc_xfer_report.csv auch nur annähernd mit den Daten in der Blockchain übereinstimmen müssen, bzw. das müsste man erstmal sicher stellen, nur wie? Dann ist es immer noch ein ziemliches Puzzlespiel. Die Zeiten in der Datei scheinen zumindest mit den Zeiten in den Withdraw-Bestätigungsmails, die Gox immer verschickt hat, übereinzustimmen. Dadurch konnte ich jedenfalls meine eigene Wallet identifizieren. Auch hier scheint wieder alles zu stimmen.
Merkwürdige finde ich in mtgox_balances die negativen Kontostände am Ende der Datei. Aber meine persönlichen Kontostände stimmen (BTC und Euro).
Zum Zeitplan: Haltet die Luft nicht an während ihr auf mich wartet. Das ist jetzt Arbeit (von der ich auch so schon reichlich habe) und nicht mal eben über einen Beitrag im Forum zu lösen. Konzentriere mich jetzt erstmal auf Sukrims 'Arbeitsauftrag'. Erscheint mir gegenwärtig (vor allem auch zu Lernzwecken) sinnvoller als das, was ich vorgeschlagen hatte. Jetzt muss ich allerdings erstmal wieder meinem Broterwerb nachgehen. Wenn es etwas Neues gibt poste ich das in diesem Thread und ihr könnt es ja auch so halten. Mitlesen tue ich auf alle Fälle.
Nochmal kurz ein Update zu dem Thema. Es gibt bei reddit ein Projekt, wo die geleakten Transaktionen mit der Blockchain abgeglichen wurden. Dort konnten schon 87% der Transaktionen zugeordnet werden. Die Ergebnisse wurden noch nicht veröffentlicht, aber die Daten sind ziemlich groß (ca. 3GB). Ich weiß nicht, ob man damit was anfangen kann. Weitere Infos hier:
http://www.reddit.com/r/mtgoxAddresses/wiki/transactionidentification