• مفهوم شناسایی مشاهدات "غیرعادی" ریشه در قرن‌ها مشاهده علمی دارد، اما صورتبندی کمی آن در قرن بیستم و عمدتاً توسط جان توکی (John Tukey) در چارچوب آمار اکتشافی (EDA) در دهه 1970 کامل شد. توکی با ابداع نمودار جعبه‌ای (Box Plot)، قاعده‌ای مبتنی بر چارک‌ها را محبوب کرد: داده‌هایی که بیش از 1.5 برابر فاصله چارکی (IQR) از چارک اول (Q1) یا سوم (Q3) فاصله دارند، به عنوان "پرت" در نظر گرفته می‌شوند. این ضریب 1.5 نه بر مبنای یک اثبات ریاضی صرف، بلکه بر پایه تجربه عملی، سادگی محاسبه و ایجاد تعادل بین حساسیت (شناسایی موارد مشکوک) و اطمینان (پرهیز از برچسب‌زنی اشتباه) انتخاب شد (مثلا در جدول سن افراد یک گروه، با مشاهده سنین 250 و 1363). این روش به دلیل شهود قوی و کاربردپذیری گسترده، به یک استاندارد صنعتی در حوزه‌های کنترل کیفیت، مهندسی قابلیت اطمینان، مالی و علوم داده تبدیل شده است.
  • نقش داده‌های پرت در تحلیل MDBF  لکوموتیو: شاخص میانگین مسافت بین خرابی‌ها (MDBF) یک معیار کلیدی برای سنجش قابلیت اطمینان لکوموتیوهاست. این شاخص از تقسیم کل کیلومتر طی شده بر تعداد خرابی‌ها به دست می‌آید. داده‌های پرت در این مجموعه، دو دسته را نشان می‌دهند: 1) پرت‌های پایین با مقادیر به طور غیرعادی کوچک MDBF که نشان‌دهنده لکوموتیوهای با خرابی‌های مکرر، هزینه عملیاتی بالا و ریسک ایمنی بالقوه هستند. 2) پرت‌های بالا با مقادیر به طور غیرعادی بزرگ  MDBFکه نشان‌دهنده عملکرد استثنایی و فرصتی برای الگوبرداری و بهبود روش‌های نگهداری هستند. شناسایی و تحلیل این پرت‌ها به مدیران ناوگان کمک می‌کند تا منابع محدود تعمیرات را بهینه تخصیص دهند (البته بدون حذف داده دراین موارد).
  • روش‌های کسب اطمینان از داده‌های پرت شناسایی‌شده: شناسایی آماری پرت‌ها تنها شروع کارست. اطمینان از صحت و استناد پذیری آن‌ها نیازمند ترکیب تحلیل کمّی با بررسی کیفی و دانش زمینه‌ای است. این فرآیند چندمرحله‌ای شامل موارد زیر است:
  1. تأیید فنی و عملیاتی (رابطه علی): داده‌های پرت باید با سوابق تعمیرات و وضعیت عملیاتی لکوموتیو مقایسه شوند. آیا خرابی مکرر یک لکوموتیو خاص ناشی از یک عیب ساختاری تکرارشونده (مثلاً مشکل در موتور) است یا صرفاً نتیجه یک حادثه تصادفی (مانند برخورد سنگ)؟ این مرحله نقش داده‌های پرت را از یک "عدد غیرعادی" به یک "مشکل فنی مشخص" ارتقاء می‌دهد.
  2. حساسیت‌سنجی روش (تنظیم آستانه): اعتبارسنجی شامل آزمایش نتایج با ضرایب مختلف IQR (مثلاً 1.2، 1.5، 2.0) است. اگر تغییر ضریب باعث حذف لکوموتیوهایی شود که از نظر فنی مشکوک شناخته شده‌اند، نشان‌دهنده آن است که آستانه انتخابی ممکن است بیش از حد سخت‌گیرانه باشد. هدف یافتن آستانه‌ای است که بهترین همخوانی را با دانش کارشناسی داشته باشد.
  3. مستندسازی و چرخه بازخورد: هر تصمیم درباره یک لکوموتیو پرت (اعم از تعمیر اساسی، بازرسی ویژه یا نادیده گرفتن موقت) باید همراه با دلیل فنی مستند شود. رصد تغییر شاخص MDBF آن لکوموتیو در دوره‌های بعدی، آزمون نهایی‌ اعتبار برای تحلیل اولیه و آستانه انتخاب‌شده است. این چرخه، سیستم را به یک ابزار یادگیرنده و تطبیقی تبدیل می‌کند (تین 289781 و 309904).
  • در نتیجه، تحلیل MDBF با شناسایی داده‌های پرت، زمانی به حداکثر اثر خود می‌رسد که یک پل مستحکم بین آمار و مهندسی زده شود. این رویکرد، تصمیم‌گیری را از حالت واکنشی به وضعیت پیشگیرانه (Proactive) و مبتنی بر شواهد سوق می‌دهد و در نهایت منجر به افزایش قابلیت اطمینان، کاهش هزینه‌ها و افزایش ایمنی عملیات تعمیرونگهداری ناوگان می‌گردد (تین 250788).

با بررسی MDBF لکوموتیوهای زیمنس در 1403 این موارد بهتر آشکار میگردد، از 99 دستگاه دارای گزارش، روزانه بطورمتوسط 76 دستگاه گرم بوده که با 29 میلیون کیلومتر سیر و 1025 خرابی، شاخص متوسط فاصله بین خرابی 28.3 هزارکیلومتر خواهد شد. در داده‌های پرت 11 لکوموتیو، 9 دستگاه در محدوده پرت پایین قرار داشتند، MDBF دستگاه 1593 با 54044 کیلومتر سیر و 9 خرابی، 6004 کیلومتر بوده و در دستگاه 1613 با 383286 کیلومتر و 2 خرابی، 191643 کیلومتر بود (تین 305022).

با بررسی دقیق و یافتن ریشه خرابی‌های پرتکرار این لکوموتیوها، میتوان به ضعفهای طراحی، کیفیت قطعات، ضعف مونتاژ، ضعف‌ بازدید، ضعف تعمیرونگهداری، ضعف تعمیرگاه و شیفت تعمیرات، و نیز ضعف‌های بهره‌برداری و راهبری پی‌برد (تین 233895).