מהו תקנון נתונים ואיך הוא יכול לשפר את ביצועי העסק ?


מה זה תקנון נתונים?

תקנון נתונים (אומרים – תיקנון נתונים) הינה פעולת טיוב נתונים המבצעת סטנדרטיזציה או האחדה של נתונים שונים בעלי משמעות זהה, במטרה ליצור תקן אחיד (סטנדרטי) בנתונים.

היתרונות העיקריים של תקנון נתונים

יתרונות תפעוליים – יצירת תקן אחיד בנתונים מאפשר פילוח וחיתוך יעיל של נתונים הרשומים בבסיס הנתונים. לדוגמא: אם אנחנו רושמים את שמות הרחובות והישובים בבסיס הנתונים ללא תקן, יהיו לנו רישומים שונים של אותו מידע, דבר המקשה מאוד על פילוח הלקוחות ומוביל ליצירת רשומות לקוח כפולות. במקרים רבים המידע מתקבל באמצעות הקלדה או מתוך שמיעה ומשתבש (כמו במשחק הילדים “טלפון שבור”). לדוגמא, נציג שלוש דוגמאות מתוך רבות אפשריות לרישום השם והכתובת של אותה לקוחה בצורה שאינה אחידה בבסיס הנתונים: מירב דינור, עמנואל הרומי 13 ת”א ;  דימור מרב, אמנועל ארומי 13 תל אביב ; מרב דנור, עמנו אל 13 תל-אביב. פעולת תקנון תאחד לכל הפחות את שמות הישובים והרחובות תחת תקן אחיד הכולל שם ישוב תקני (רשמי), שם רחוב תקני, קוד ישוב, קוד רחוב. הרשומה המתוקננת תראה כך: מירב דינור, עמנואל הרומי 13 תל אביב – יפו ויתווספו לה קודי הישוב והרחוב בהתאמה. פעולות תקנון ניתן לבצע גם בשמות של מוצרים, קטלוג פריטים, עצי מוצר ועוד.

יתרונות שיווקיים ושירותיים – מידע מלוכלך ושאינו אחיד מוביל לטעויות החל ממשלוח מכתבים, או מוצרים שהלקוחות הזמינו לכתובות לא נכונות, דרך איבוד נאמנות הלקוחות ועד איבוד הלקוחות עצמם עקב טעויות חוזרות ונשנות שעסקים עושים בשימוש במידע שגוי ושאינו תקני.

אפשרי (אך פחות מומלץ) לתקנן שמות של אנשים / לקוחות ובעיקר לאחד שמות נרדפים תחת השם הרשמי כביכול. לדוגמא: אבי, אברשה, אברום, אברם, יתוקננו כולם ל- אברהם.

שיפור ביצועים – יצירת אינדקס אחיד של נתוני התקן ועבודה מול קוד התקן (לדוגמא קוד הישוב של תל אביב – יפו = 5000) מוביל לשיפור משמעותי בביצועי בסיס הנתונים.

תקנים שונים ומשונים לאותה הכתובת

בארץ קיימים תקנים שונים לכתובות: תקן משרד הפנים, תקן הלמ”ס (הלשכה המרכזית לסטטיסטיקה), תקן דואר ישראל, תקן חברת מפה. חלק מהתקנים חופפים וחלקם אינם מלאים. התקן הרשמי היחיד המומלץ על ידנו הוא תקן משרד הפנים, שכיום מנגיש את טבלאות התקן הגולמיות באופן חופשי לשימוש הציבור. להורדת טבלאות התקן לחצו כאן.

קואורדינטות – נתוני קו אורך וקו רוחב של כתובת מאפשרים מיפוי נתונים על המפה באמצעות מערכות GIS ומערכות מיפוי אחרות ללא תלות בתקן מקומי כזה או אחר. נתוני קו אורך וקו רוחב הינם גלובאליים ויכולים לייצג כל נקודה על פני כדור הארץ.

לדוגמא: נתוני הקואורדינטה של הכתובת שד’ ירושלים 14 תל אביב היא 32.0552812 , 34.759470299999975

מסקנות

  • לתקנון והאחדת נתונים (standardization / normalization) יתרונות רבים והשפעתם על איכות המידע העסקי משמעותית בטווח הארוך, אולם גם אם יתרונותיה לא תמיד נראים לעין בטווח הקצר ההשקעה משתלמת.
  • חשוב לתקנן את הנתונים בכניסה למערכות המידע באמצעות מעיין Data Quality Firewall, כך שמידע חדש שמוזן למערכת יהיה אחיד ומתוקנן לפני שיזרום בנהר המידע ויפגום במערכות מידע אחרות.
  • במקרים רבים הגישה השכיחה בארגונים היא לטפל בבעיה רק אחרי שהיא מעיקה באמת. במקרה כזה, עדיף לבצע מהלך טיוב נתונים לגבי נתונים שקיימים כבר במערכות המידע.
  • במטרה לצמצם את זיהום הנתונים החדשים או המשתנים, מוצע למפות את נקודות המגע עם לקוחות, מקורות מידע מהן ניזון הארגון, נקודות הזנה / שינוי של מידע בארגון על מנת לטפל בתקנון הנתונים בשלבים קריטיים אלה. נקודות אלה יהיו בד”כ דפי אינטרנט (שירות עצמי), טופסי הצטרפות (הקלדה), נציגי שירות במוקד, אנשי מכירות שטח וכדומה.
  • לאחר שמיפינו את נקודות המגע הללו, ניתן ליישם במקרים רבים יצירת חוקים המאפשרים במקרה של נתוני כתובת בחירה מתוך התקן ובמקרים אחרים לא לאפשר הזנת מידע ללא בדיקה. לדוגמא: במספר טלפון בישראל: בחירה מרשימת קידומות אפשריות, מספר הטלפון יכיל מספרים בלבד באורך 7 פוזיציות.




יש לכם שאלה שקשורה למאמר?

לחצו כאן למעבר לדף יצירת הקשר

תוכן המאמר היה מעניין או עזר לכם? שתפו אותו