منظف النصوص
حوّل النصوص الفوضوية وغير المنظمة إلى محتوى نظيف ومنظم. أزل الأسطر المكررة، احذف الأسطر الفارغة، احذف وسوم HTML، عيّر المسافات، ورتّب أبجديًا. يتيح لك خط التنظيف القابل للتكوين تطبيق أي مزيج من العمليات في تمريرة واحدة. ضروري لتنظيف البيانات، وتحليل السجلات، وإزالة التكرار من القوائم، وتحضير المحتوى.
ماذا تفعل هذه الأداة؟
يطبق منظف النصوص عمليات تنظيف متعددة لتحويل النصوص غير المنظمة إلى صيغ قابلة للاستخدام. يمكنه إزالة الأسطر المكررة (مع الاحتفاظ بالحدوث الأول)، وحذف الأسطر الفارغة، وتقليم المسافات الزائدة في بداية ونهاية كل سطر، ودمج المسافات المتعددة المتتالية في مسافة واحدة، وإزالة وسوم HTML/XML بالكامل، ورتّب الأسطر أبجديًا (مع خيار الترتيب العكسي). تُطبّق العمليات بترتيب ثابت لضمان نتائج متوقعة، ويمكنك تبديل كل عملية بشكل فردي لتخصيص خط التنظيف الخاص بك.
كيف تعمل
يعالج الأداة النص عبر خط تحويل قابل للتكوين. أولاً، تُزال وسوم HTML باستخدام مطابقة الأنماط المنتظمة إذا تم تمكين هذا الخيار. ثم يُقلم كل سطر من المسافات الزائدة في بدايته ونهايته. تُدمج المسافات المتعددة المتتالية إلى مسافة واحدة. تُفلتر الأسطر الفارغة إذا تم اختيارها. تُزال الأسطر المكررة بناءً على مطابقة السلسلة النصية الدقيقة (حساسة لحالة الأحرف). وأخيرًا، إذا كان الترتيب مفعّلًا، تُرتّب الأسطر باستخدام مقارنة السلاسل النصية الحساسة للمحلية في JavaScript. يضمن ترتيب المعالجة الثابت نتائج متسقة ومتوقعة بغض النظر عن الخيارات المحددة.
الميزات
- إزالة الأسطر المكررة (يحتفظ بالحدوث الأول)
- إزالة الأسطر الفارغة
- تقليم المسافات من بداية ونهاية كل سطر
- دمج المسافات المتعددة في مسافة واحدة
- إزالة وسوم HTML وXML
- ترتيب الأسطر أبجديًا (تصاعديًا أو تنازليًا)
- خط قابل للتكوين — ادمج أي عمليات
كيفية الاستخدام
- 1
الصق النص الفوضوي
أدخل النص الذي يحتاج إلى تنظيف — استجابات الاستبيانات، ملفات السجلات، تصدير البيانات، المحتوى المستخرج من الويب، القوائم المنسوخة، أو أي نص غير منظم.
- 2
حدد عمليات التنظيف
فعّل العمليات التي تحتاجها. التوليفات الشائعة: إزالة التكرار + الترتيب للقوائم الفريدة المرتّبة؛ إزالة HTML + التقليم للمحتوى الويب؛ إزالة الأسطر الفارغة + إزالة التكرار لتنظيف البيانات.
- 3
راجع النتيجة
يظهر الناتج المنقّح فورًا. ترتيب المعالجة الثابت هو: إزالة HTML → التقليم → دمج المسافات → إزالة الأسطر الفارغة → إزالة التكرار → الترتيب.
- 4
انسخ النص المنقّح
انقر على 'نسخ' لنسخ النتيجة إلى الحافظة. الصقها في جدول البيانات، قاعدة البيانات، محرر الأكواد، أو المستند.
حالات الاستخدام الشائعة
إزالة التكرار من البيانات
أزل الإدخالات المكررة من قوائم البريد الإلكتروني، وقواعد بيانات العملاء، والبيانات المصدّرة، وقوائم جهات الاتصال قبل استيرادها إلى أنظمة CRM أو أنظمة التسويق.
تحليل ملفات السجلات
نظّف سجلات الخوادم وسجلات التطبيقات عن طريق إزالة التكرار، وإزالة الطوابع الزمنية إذا لزم الأمر، والترتيب لتحليل الأنماط.
استخراج محتوى الويب
أزل وسوم HTML من المحتوى المستخرج أو المنسوخ من الويب، عيّر المسافات، واعد النص النظيف لإعادة النشر أو التحليل.
تنظيف بيانات الاستبيانات
نظّف استجابات الاستبيانات الفوضوية التي تحتوي على مسافات زائدة، وإدخالات فارغة، وإرسال مكرر قبل التحليل.
نصائح وأفضل الممارسات
- كشف التكرار حساس لحالة الأحرف: 'Apple' و 'apple' يعتبران مختلفين. استخدم أداة تحويل حالة الأحرف أولاً إذا كنت تحتاج إلى إزالة تكرار غير حساس لحالة الأحرف
- ترتيب المعالجة مهم: تُزال HTML أولاً حتى لا تصبح وسوم <p> أسطرًا فارغة تحتاج إلى إزالتها لاحقًا
- لبيانات CSV، احذر من خيار دمج المسافات — فقد يغير تنسيق الحقول إذا كانت المسافات ذات دلالة
- ادمج مع عداد الكلمات لتحليل البيانات المنقّحة ورؤية انخفاض عدد الأسطر وعدد الأحرف