Anzeige - [Hier werben / Mediadaten]
(?) Tags raten (?) (edit)
 
Reply to this topicStart new topicStart Poll
> Alte Datenbank neu bestücken - Abgleich wie?
kekskruemel
---
Geschrieben am: Do 26.10.2006, 16:48
Report PostQuote Post

AyomRank 5
**********

Gruppe: Member (aktiv)
Beiträge: 330
Mitglied seit: 8.11.2005


Hallo Leute,

ich habe leider ein kleines Problem.

Ich habe in meiner alten Datenbank die Adressen und Namen enthalten von den Tankstellen bei Tankcheck.de

Diese knapp 2300 Datensätze sollen beibehalten werden, da ich zu diesen recht viele Preise und weiter Details inzwischen in der Datenbank habe.

Nun habe ich aber auch die kompletten Daten von fast allen weiteren Deutschen Tankstellen.

Diese Datenbank hat etwa 15600 Datensätze! Jedoch nur mit PLZ, Ort, Straße und Name.

Nun möchte ich aber ganz gerne aus diesen 15600 Einträgen die raushaben, die ich schon in der bestehenden DB habe, damit ich nur die neuen einfüge?!

Wie kann ich das machen?

Kann ich evt. beide Tabellen in Excel zusammenfassen und dann mit einem Makro doppelte bzw. Ähnlliche finden lassen?



--------------------
Top
PMEmail PosterUsers WebsiteICQ
Top
 
 
Gast
#2 Geschrieben am: Do 26.10.2006, 19:29 (+02:41)
Report PostQuote Post

Unregistered







Hallo

Ich geh davon aus, dass es keine id gibt, sowas wie eine "internationale Tankstellennummer". Das heisst du musst Adressen vergleichen, was ein riesen Aufwand ist. Problem beim vergleichen von Adressen: Personen-, Firmen, Strassennamen, Telefon- und sogar Hausnummern werden unterschiedlich geschrieben.

2 Varianten, je nachdem wie duplettenfrei du deine DB brauchst:

1.)
Man erstellt eine temporäre Tabelle mit den neuen Adressen (gleiche Struktur) und vergleicht Schritt für Schritt Strasse und Hausnummer, Telefon. Findet man hier Übereinstimmungen kann man diese wahrscheinlich ungeprüft löschen, man wird aber immer noch viele doppelte haben. Nun kann man wahrscheinlich noch einige doppelte Adressen mit soundex oder like finden. Hier muss man aber leider die Treffer vor dem löschen noch prüfen, ob es wirklich doppelte sind. Evtl. gibt es dann noch weitere Daten wie z.B. Emailadressen anhand denen man dopplete Einträge finden kann.

Der Weg ist halbwegs schnell (ca.2-4h), aber es bleiben wahrscheinlich einige (100-200?) Dupletten übrig.

2.)
Wenn du die DB komplett duplettenfrei willst, solltest du die neue Tabelle mit den Werten aus der alten Tabelle ergänzen. Das bedeutet aber auch, dass du die Restmenge der Adressen, die du nicht automatisch zuordnen kannst von Hand durchgehen musst oder diese Informationen verwerfen.


Um eine Entscheidung zu treffen welche Variante du wählen solltest, könntest du
CODE

SELECT count(*) from adressneu as neu, adressalt as alt where alt.strassename = neu.strassenname and alt.hausnummer = neu.hausnummer


Wenn du hiermit schon einen grossen Teil erwischst ....


Gruss

Thomas
Top
Top
 
Thema wird von 0 Benutzer(n) gelesen (0 Gäste und 0 anonyme Benutzer)
0 Mitglieder:
Trackback-Url: http://www.ayom.com/track/t/14685

Topic Options Reply to this topicStart new topicStart Poll

 


> Ähnliche Themen
Daten in Datenbank einpflegen kekskruemel 151 8 Mo 24.11.2008, 20:04
Datenbank migration edi 85 2 Mo 24.11.2008, 14:23
Ajax - Chat mit Datenbank jAuer 72 0 So 23.11.2008, 17:02
Geolocation Datenbank Peter H 447 4 Fr 31.10.2008, 10:53
ip to city datenbank gesucht (geolocation) Big Rob 135 3 Fr 31.10.2008, 08:49
7 Jahre alte Google-Suche profo 1097 9 Sa 18.10.2008, 17:51
Sehr starke und alte Website sucht Linkpartner ninjas.de 354 2 Di 30.09.2008, 14:43
Homepage-Werkzeuge - gemeinsame Datenbank jAuer 347 3 Di 30.09.2008, 07:55
Nahrungsmittel Datenbank rocoloco 230 7 Mi 24.09.2008, 17:06
Alte PR4 Domain günstig zu verkaufen omc 226 0 Mi 24.09.2008, 06:15




Anzeige - [Hier werben / Mediadaten]



Anzeigen


[Hier werben / Mediadaten]