טיוב נתונים – עדכון והשבחת נתונים


טיוב נתונים וחשיבותו העסקית:

טיוב נתונים או טיוב מידע הוא תהליך לשיפור איכות הנתונים הקיימים בבסיסי נתונים. השיפור נדרש בנתונים שאינם שלמים, אינם מדויקים, אינם נכונים, כפולים וכדומה.

שימושים שכיחים לטיוב נתונים:

  • איתור לקוחות מנותקי קשר באמצעות הצמדת מספרי טלפון עדכניים.
  • הגדלת הרווח – צמצום עלויות תפעוליות: חסכון בעלויות מוקדים (ע”י הפחתת מספרי טלפון שגויים), חסכון בעלויות דפוס, הפקה וביול בדואר (ע”י ניפוי רשומות כפולות), הפחתת דואר חוזר (ע”י תקנון וטיוב כתובות, בדיקת תקינות לוגית של הכתובת, הצמדת מיקוד והכנה לדיוור).
  • חיזוק הקשר עם הלקוחות ע”י דיוק הפניה אליהם, הפחתת פניות סרק ופניות כפולות, שיפור תדמית הארגון והעלאת שביעות רצון לקוחות.
  • שיפור ביצועי בסיס הנתונים – ע”י תקנון המידע בבסיס הנתונים, טיפול ברשומות כפולות מתאפשר חיזוק פוטנציאל השימוש בכלים כגון מחסני נתונים (Data Warehouses), מערכות Business Intelligent) BI), מערכות ניהול קשרי לקוחות (CRM) ו- Big Data.
  • טרנספורמציה דיגיטלית – סיוע לארגונים במעבר לארגון דיגיטלי.
  • ניתוח מורפולוגי בעברית – חיפוש חכם על טקסטים הכתובים בצורות שונות. מאפשר השוואות טקסט של שמות אנשים, שמות של מקומות, מוצרים, פעולות ועוד.
  • טיוב קטלוגים / טיוב מקטים (מק”טים), מוצרים ועצי מוצר – MRO Data Cleansing.


טיוב נתונים והשבחתם:

דאטה מדיה מתמחה בפתרון בעיות איכות נתונים וכתוצאה מכך בשיפור הרווחיות של חברות ועסקים. במרוצת השנים פיתחנו ידע וצברנו ניסין רב, פיתחנו כלי תוכנה ויכולות מתקדמות לצד מתודולוגיות ייחודיות ובסיסי נתונים נרחבים ומעודכנים, באמצעותם אנו מבצעים תהליכים ממוכנים של טיוב והשבחת נתונים.
תהליכים אלו כוללים בין השאר: דירוג וניפוי נתונים שאינם תקינים, מיותרים או מיושנים ; פירוק שדות ; תקנון נתונים ; תרגום נתונים ; טיפול ברשומות כפולות ; השוואות נתונים מול קבצי Synonyms מועשרים לחיפוש ותקנון שדות אלפא-נומריים ; השוואות “רכות” (fuzzy string searching) מבוססות מנגנונים פונטיים (מצלול) באמצעות Soundex עברי (Sound-Ex) ייחודי שפותח על ידנו הפועל במספר רמות החלטה והשבחת המידע מול מאגרי הנתונים של דאטה מדיה (MDM). כלים אלה מופעלים על ידי אנשי מקצוע מיומנים ומאפשרים לנו לספק ללקוחותינו פתרונות איכות נתונים כגון: שירותי טיוב נתוני זכויות העמיתים בגופים מוסדיים – בהתאם להוראות הממונה על שוק ההון לטיוב נתונים ואיתור עמיתים ומוטבים מנותקי קשר, איתור לקוחות שאבד איתם הקשר, הסבת נתונים במערכות CRM, ניהול בסיסי נתונים, הקמה ותפעול בסיסי נתונים של מועדוני לקוחות, התייעלות תפעולית במוקדים טלפוניים, סיוע ביישום תכניות נאמנות ושימור לקוחות וכיו”ב.

 

טיוב נתוני לקוחות:

היגיינה, המרה, תקנון וטיוב נתונים:

  • הצמדת מספרי טלפון עדכניים לרשומות – מספרי טלפון קוויים ומספרי טלפון סלולרים בכל הרשתות.
  • ETL – המרת קבצים, קליטה וטעינה של נתונים מקבצים בפורמטים שונים ובמבנים שונים.
  • היגיינה – ניקיון של תווים מיותרים, רווחים כפולים וכיו”ב.
  • פירוק כתובות – פירוק מרכיבי כתובת (רחוב, בית, דירה, כניסה, קומה, ישוב, תא דואר וכיו”ב) למבנה טבלאי מסודר.
  • פירוק שמות – פירוק וסידור שמות פרטיים, שמות משפחה (כולל שמות מרובי חלקים), פירוק ותקנון תארים.
  • תקנון וסטנדרטיזציה של כתובות (שמות הרחובות והישובים, קודי ישוב ורחוב לפי תקן משרד הפנים).
  • סימון רשומות עסקיות (עסקים / חברות / מוסדות וכיו”ב) במגוון שיטות ויצרת score של רמת ה”עסקיות” של הרשומה.
  • תרגום אוטומטי של שמות אנשים משפה זרה לעברית, או מעברית לשפה זרה.
  • תרגום אוטומטי של כתובות משפה זרה לעברית, או מעברית לשפה זרה.
  • אימות נתונים – בדיקת תקינות מספר ת.ז והשלמת ספרת ביקורת.
  • הצמדת מיקודים עדכניים לכתובות ולתאי דואר בשיטת המיקוד העדכנית.
  • סימון ואיחוד רשומות למשקי בית.
  • סימון רשומות כפולות (Merge/Purge).

אופטימיזציה של תהליכי שיווק ישיר וייעול מערכי טלמרקטינג:

  • בדיקת תקינות טכנית של מספרי טלפון קווים וסלולריים והכנת קבצים לטלמרקטינג. ראו הרחבה כאן.
  • בדיקת תקינות מייל (Email Validation) – בדיקת תקינות דוא”ל, תקנון נתוני domain, ביצוע בדיקה טכנית שמוודאת האם כתובת המייל קיימת ותקינה למניעת invalid, abuse, complaint, inactive, and spam-trap email address.
  • השלמת נתונים על פי כתובת מייל – שם פרטי, שם משפחה, תפקיד או עיסוק (ברשומה עסקית).
  • הכנת קבצים לדיוור ישיר – מניעת דואר שגוי פרואקטיבית – נטרול כתובות שגויות על בסיס בדיקה לוגית של שלמות הכתובת והתאמתה לדיוור ישיר, הכנת שורות נמען וכתובת מוכנות להדפסה.

טרנספורמציה דיגיטלית:

  • טיוב נתוני לקוחות והצמדת מספרי טלפון סלולריים לצורך טעינתם למערכות פרסום המאפשרות טירוג על פי מייל ו/או מספר טלפון כגון: LinkedIn Matched Audiences, Facebook Custom Audiences, Google Customer Match.
  • טיוב נתוני לקוחות והצמדת מספרי טלפון קווים וסלולריים לשימוש במוקדי אקטיבציית לקוחות (שיחה עם לקוח ומשלוח טופס דיגיטלי לאיסוף נתונים וקבלת הסכמות הנדרשות על פי חוק).
  • טופס סלולרי לאיסוף נתונים וקבלת הסכמות מלקוחות.

השבחה והעשרה של מידע:

  • הצמדת נתונים סוציואקונומיים וסוציודמוגרפיים לקובץ הנתונים של הלקוח, המרחיב את יכולת הפילוח ומהלכי השיווק מול לקוחות, בהתבסס על נתוני מפקד האוכלוסין והדיור (המפקד המתגלגל) של הלמ”ס (הלשכה המרכזית לסטטיסטיקה): סיווג בית האב לרמות על פי Life Time Value, רמת הכנסה (עשירון / קלסטר), שיוך למגזר (ערבי / רוסי / דתי / כללי).
  • הצמדת נתוני מיפוי לכתובת: Geocoding לכתובת והצמדת קואורדינאטות GIS.
  • הצמדת מספר אזור סטטיסטי לכתובת על פי נתוני למ”ס.
  • שיוך כתובת לגוש / חלקה.
  • נתונים אודות נכסי נדל”ן ברמה הארצית – נתוני גיל בנין, מספר נכס (זיהוי בנין), נתוני עסקאות נדל”ן ברמת הכתובת – כולל עסקאות נדל”ן הסטוריות.
  • שיוך כתובת לאזור בניה חדשה (בניה חדשה / שכונה חדשה).
  • בניית נתוני לקוחות על מפה אינטראקטיבית (GIS).

הצמדת כתובות מייל:

  • הצמדת כתובות מייל לרשומות עסקיות של בעלי תפקידים בארגונים.
  • חיפוש לידים עסקיים לפי דומיין (לידים בחברות), לחלקם ניתן לשייך את התפקיד בארגון.
  • חיפוש לידים עסקיים לפי טכנולוגיות הפועלות בדומיינים.
  • חיפוש והשלמת מיילים לפי שמות בעלי תפקיד ודומיין / שם חברה.

טיוב נתונים אוטומטי:

  • טיוב אוטומטי – שירותי טיוב אוטומטיים לחלוטין מכספת לכספת, שנועדו לענות על צורך של טיוב חוזר ונשנה (כגון batch יומי).
    המערכת שלנו דוגמת כספת מידע (שלנו או של הלקוח), תקלוט ותטייב את הקובץ ובסיום תהליך טיוב הנתונים תעלה את הקובץ לכספת ותשלח דוחות במייל לנמענים אצל הלקוח, לגבי תהליך הטיוב שבוצע. כל זאת אוטומטית, תוך זמן קצר וללא מגע יד אדם!
  • מערכת טיוב אצל הלקוח – מערכת אינטרנטית מאובטחת המאפשרת ללקוח לטעון קבצים בעצמו ולבצע תהליך טיוב נתונים קבוע בכל עת. המערכת שולחת מיילים ומספקת דוחות בתום הריצה.
  • טיוב online – שירותי רשת (WebService) המאפשרים ליישם פתרונות איכות נתונים תפורים בהתאם לצורך, באפליקציות (אתרי אינטרנט, מערכות CRM, BI, רישום לקוחות וכיו”ב).

 

ארגז הכלים שלנו:

  • ידע נרחב וניסיון רב שנים בתחומי טיוב הנתונים, השבחת נתונים ושיווק מבסיסי נתונים.
  • מאגר מידע “אוכלוסייה ובתי אב”, הכולל אלפון טלפונים המתעדכן ברמה היומית.
  • מאגר נתוני מפקדי האוכלוסין של הלשכה המרכזית לסטטיסטיקה (למ”ס) הכולל מידע המתעדכן תדיר בנתונים מושבחים מחברת points המתמחה ב- Location Intelligence.
  • כלי תכנה מתקדמים לחיפוש, איתור והשוואה ולביצוע פעולות היגיינת נתונים (Data hygiene), פירוק נתונים (parsing), תקנון כתובות (Standardization), טיוב מידע (Data Cleansing), סימון נתונים (Data Tagging), השבחת נתונים (Data Enrichment), השוואה פונטית של נתונים (soundex) בשפה העברית, במספר דרגות עומק.
  • טבלאות עזר רבות ונרחבות הכוללות מילונים, שמות נרדפים (Synonyms) וטבלאות המרה.
  • ענן מידע לטיוב online – כלי טיוב שלנו מונגשים כשירותי רשת במערכות מידע ואתרים של לקוחות.
  • פתרונות טיוב Batch ללא מגע יד אדם – טיוב אוטומטי מכספת מידע לכספת מידע.
  • מערכת אוטומטית הלומדת ומשתפרת בכל העת, תוך כדי עבודה.
  • אבטחת מידע מהשורה הראשונה.

 

הסבות נתונים במערכות CRM:

  • הסבת נתונים ממערכת ישנה למערכת CRM חדשה – חיוני כשמבצעים הסבת מערכות CRM.
  • הסבת נתונים בין מערכות מובילות: 365 Salesforce, Dynamics ומערכות CRM מקומיות.
  • פירוק שמות לקוחות והרכבתם הנכונה – פירוק שם פרטי ושם משפחה מאפשר ביצוע פניה אישית נכונה.
  • פירוק ותקנון כתובת – מאפשר למפות את הלקוחות במערכות CRM רבות.
  • ניפוי נתונים כפולים ואיחוד נתונים ממקורות שונים.
  • זיהוי מילות מפתח בתוך טקסט חופשי כגון טקסט של שדה “הערות” ויצירת תקן אחיד של מילות מפתח המאפשר קיטלוג טקסט חופשי וחילוץ תובנות ממנו.
  • סיווג וקטלוג נתונים מתוך טקסט חופשי.
  • מנגנוני השוואה פונטיים (Fuzzy Match) לזיהוי נתונים הכתובים בשגיאות כתיב.
  • פירוק והיגיינה של נתונים מתוך טקסט והעברתם לעמודות רלוונטיות – convert unstructured texts to structured data. דוגמא: זיהוי שמות אנשים, מספרי טלפון, שמות של מוצרים ומותגים, סוגי טיפול, מקומות וכו’ והעברתם לעמודות נפרדות.
  • תרגום של נתונים בטקסט רב לשוני.

 

טיוב נתונים אנליטיים (Data Analysis):

  • הכנת דאטה לפני אנליזה (data preparation).
  • הסבת נתונים ממקורות שונים.
  • טיוב נתונים למערכות BI.
  • יצירת סטנדרט אחיד בשמות, כתובות, תאריכים, טלפונים ופרטים אחרים (Standardization).
  • ניפוי כפולים ואיחוד נתונים.

מנוע ניתוח מורפולוגי בעברית

פיתחנו מנוע חיפוש מורפולוגי משכולל, המאפשר לבצע חיפוש חכם והשוואות על טקסטים הכתובים בצורות שונות.

  • מאפשר השוואות טקסט של שמות אנשים, שמות של מקומות, מוצרים, פעולות ועוד.
  • כולל חיפוש באמצעות מילונים ושמות נרדפים (synonims) נרחבים.
  • כולל חיפוש באמצעות סאונדקס עברי (Soundex).
  • כולל חיפוש לפי חיפוש מקורב וחלקי.
  • מאפשר תיוג מידע.

טיוב נתוני ERP:

טיוב נתונים בתחום הייצור והלוגיסטיקה מונע כפילויות רכש, בעיות מלאי, השבתת ציוד, רכישות מלאי מיותר ועוד.

אנו מספקים ליווי וביצוע פרוייקטים בשיתוף עם חברה מובילה מחו”ל המספקת שירותים גלובליים בתחום master data management , ISO 8000.

מבין השירותים שאנו מספקים בתחום:

  • טיוב מקטים (מק”ט – מספר קטלוגי), פריטים ועצי מוצר.
  • זיהוי מקטי”ם כפולים.
  • איחוד מקטים.
  • איחוד וסטנדרטיזציה של שמות יצרנים.
  • איחוד שמות יצרנים בין שפות שונות.
  • איחוד שמות מוצרים ופריטים בין שפות שונות.
  • בניית MDM אחיד.
  • מערכת data Governance.

 

לקריאה נוספת: מאמרים בנושא טיוב נתונים

 
אפשרויות שיתוף