Was sind strukturierte Daten?

Strukturierte Daten beziehen sich auf alle Daten, die sich in einem festen Feld innerhalb eines Datensatzes oder einer Datei befinden. Dies schließt Daten ein, die in relationalen Datenbanken und Tabellen enthalten sind.


Eigenschaften strukturierter Daten

Strukturierte Daten hängen zunächst von der Erstellung eines Datenmodells ab, einem Modell der Arten von Geschäftsdaten, die aufgezeichnet werden, und wie sie gespeichert, verarbeitet und abgerufen werden. Dies beinhaltet die Definition, welche Datenfelder gespeichert werden und wie diese Daten gespeichert werden: Datentyp (numerisch, Währung, alphabetisch, Name, Datum, Adresse) und etwaige Einschränkungen der Dateneingabe (Anzahl der Zeichen; beschränkt auf bestimmte Begriffe wie z als Herr, Frau oder Dr .; M oder F).

Strukturierte Daten haben den Vorteil, dass sie einfach eingegeben, gespeichert, abgefragt und analysiert werden können. Aufgrund der hohen Kosten- und Leistungsbeschränkungen bei Speicher, Speicher und Verarbeitung waren relationale Datenbanken und Tabellenkalkulationen mit strukturierten Daten einst die einzige Möglichkeit, Daten effektiv zu verwalten. Alles, was nicht in eine straff organisierte Struktur passen konnte, musste in einem Aktenschrank auf Papier aufbewahrt werden.

Strukturierte Daten verwalten

Strukturierte Daten werden häufig mit SQL (Structured Query Language) verwaltet, einer Programmiersprache, die zum Verwalten und Abfragen von Daten in relationalen Datenbankverwaltungssystemen erstellt wurde. Ursprünglich von IBM in den frühen 1970er Jahren entwickelt und später von Relational Software, Inc. (jetzt Oracle Corporation) kommerziell entwickelt.

Strukturierte Daten waren eine enorme Verbesserung gegenüber rein papierbasierten unstrukturierten Systemen, aber das Leben passt nicht immer in hübsche kleine Kästchen. Infolgedessen mussten die strukturierten Daten immer durch Papier- oder Mikrofilmspeicherung ergänzt werden. Da sich die technologische Leistung weiter verbessert hat und die Preise gesunken sind, konnten unstrukturierte und halbstrukturierte Daten in Computersysteme eingebracht werden.


Unstrukturierte und halbstrukturierte Daten

Unstrukturierte Daten sind all die Dinge, die nicht so einfach klassifiziert werden können und in eine ordentliche Box passen: Fotos und Grafiken, Videos, Streaming-Instrumentendaten, Webseiten, PDF-Dateien, PowerPoint-Präsentationen, E-Mails, Blogeinträge, Wikis und Textverarbeitungsdokumente .

Halbstrukturierte Daten sind eine Kreuzung zwischen beiden. Es handelt sich um eine Art strukturierter Daten, aber es fehlt die strenge Datenmodellstruktur. Bei halbstrukturierten Daten werden Tags oder andere Arten von Markierungen verwendet, um bestimmte Elemente in den Daten zu identifizieren, aber die Daten haben keine starre Struktur. Beispielsweise kann Textverarbeitungssoftware jetzt Metadaten enthalten, die den Namen des Autors und das Erstellungsdatum anzeigen, wobei der Großteil des Dokuments nur unstrukturierter Text ist. Bei E-Mails werden Absender, Empfänger, Datum, Uhrzeit und andere feste Felder zu den unstrukturierten Daten des E-Mail-Nachrichteninhalts und aller Anhänge hinzugefügt. Fotos oder andere Grafiken können mit Schlüsselwörtern wie Ersteller, Datum, Ort und Schlüsselwörtern versehen werden, sodass Grafiken organisiert und lokalisiert werden können. XML und andere Auszeichnungssprachen werden häufig zum Verwalten von halbstrukturierten Daten verwendet.


Strukturierte Datentechnologiestandards

SQL ist seit 1986 ein Standard des American National Standards Institute. Es wird vom InterNational Committee for Information Technology Standards (INCITS) verwaltet. Technisches Komitee DM 32 Datenverwaltung und Austausch. Das Komitee hat zwei Aufgabengruppen, eine für Datenbanken und eine für Metadaten. HP, CA, IBM, Microsoft, Oracle, Sybase (SAP) und Teradata sowie mehrere Bundesbehörden nehmen teil. Beide Projektdokumente des Komitees enthalten Links zu weiteren Informationen zu jedem Projekt. SQL wurde 1987 zum ISO-Standard (International Organization for Standards). Die veröffentlichten Standards sind bei der erhältlich ANSI eStandards Storeunter der Klassifizierung INCITS / ISO / IEC 9075.

Schreibe einen Kommentar