Was ist die Poisson-Verteilung in Statistik und Data Science? (12.05.21)

Im Bereich Data Science ist es eine Notwendigkeit, die Konzepte von Statistik und Wahrscheinlichkeit zu erlernen, da wir ohne sie auch die einfachsten Operationen nicht durchführen können. Wir müssen zu jedem Zeitpunkt überlegen, in welche statistische Gleichung wir passen, um unsere Arbeit einfacher und vor der Öffentlichkeit präsentierbar zu machen. Wahrscheinlichkeit und Statistik spielen nicht nur in der Datenwissenschaft eine zentrale Rolle, sondern auch in unserem täglichen Leben wie der Schätzung der Kosten eines Produkts, dem Werfen einer Münze, dem Kartenspielen und der Schätzung der Wahrscheinlichkeit, ein Karo-Ass zu erhalten usw. Also diese beiden Begriffe sind irgendwie mit uns verbunden.

Nun ist es für einen Data Scientist von größter Bedeutung, mit der ihm zur Verfügung gestellten Datenbank herumzuspielen und jeder Organisation dabei zu helfen, aussagekräftige Erkenntnisse aus der Datenbank zu gewinnen, indem sie entweder Grafiken oder Erstellen interaktiver Dashboards oder vieles mehr. Außerdem spielt die Wahrscheinlichkeit eine wichtige Rolle beim Abrufen der Details der Daten und der Verteilung der Daten. Es gibt zahlreiche Möglichkeiten, die Verteilung unserer Daten mit Hilfe der Wahrscheinlichkeit zu ermitteln und werden als Wahrscheinlichkeitsverteilungen bezeichnet. Einige Wahrscheinlichkeitsverteilungen sind Binomialverteilung, Normalverteilung, Standardnormalverteilung, Poissonverteilung usw. Heutzutage dreht sich das Thema um die Poissonverteilung. Lassen Sie uns also tief eintauchen und die Bedeutung dieses Begriffs verstehen:

Beschreibung

Die Poisson-Verteilung ist eine Art von Wahrscheinlichkeitsverteilung, die der Binomialverteilung sehr ähnlich ist, dh sie wird auf a . angewendet diskrete Zufallsvariable mit einigen Werten. Es wird verwendet, um zufällige Ereignisse zu beschreiben, die selten über ein Kontinuum von Raum oder Zeit auftreten. Nehmen wir zum Beispiel an, wir haben ein Ereignis A und wir befassen uns damit, die Häufigkeit des Auftretens von Ereignis A zu bestimmenzu einem bestimmten Zeitraum t wenden wir die Poisson-Verteilung an. Dabei kann die Zeit in n gleiche Intervalle mit der Länge t/n aufgeteilt werden. Diese n Intervalle werden auch Bernoulli-Versuche genannt.

Jetzt tritt das Problem bei der Berechnung der Wahrscheinlichkeit des Ereignisses auf, da die Intervalle, in die die Zeit aufgeteilt wird, einen sehr geringen Wert haben und wir daher keine Poisson-Verteilung anwenden können, da wir nicht sagen können dass das Ereignis, das einmal in einem bestimmten Zeitintervall aufgetreten ist, in dieser Zeit nicht wieder auftreten kann.

Um dieses Problem zu lösen, verlängern wir das Zeitintervall so weit wie möglich, so dass sich das Ereignis nicht wiederholt in diesem Zeitraum. Die Formel zur Berechnung der Wahrscheinlichkeits-Massenfunktion für die Poisson-Verteilung lautet:

P(x) = em.mx / x!, wobei e die Napersche Basis mit einem Wert von 2.183 genannt wird, x ist die Nr. wie oft das Ereignis auftritt, und m ist der Mittelwert der durch m= np gegebenen Zufallsvariablen (Anzahl der Versuche . Erfolgswahrscheinlichkeit).

Der Wert von em kann erhalten werden aus mathematische Tabellen. Außerdem ist hier eine wichtige Sache zu beachten, dass die Poisson-Verteilung die Ausfallwahrscheinlichkeit, dh 1-p = q, nie berücksichtigt, wenn es sich hier nur um den Erfolg und den Mittelwert des Datensatzes handelt. Außerdem sind der Mittelwert und die Varianz in der Poisson-Verteilung gleich und werden durch dieselbe Formel angegeben.


Schlussfolgerung

Aus dem oben Gesagten können wir schlussfolgern, dass immer, wenn es um das Finden von die Wahrscheinlichkeit von zeitabhängigen Daten, dann können wir die Poisson-Verteilung anwenden und das auch, wenn wir die Zahl dividieren können. von Intervallen in ziemlich große Werte. Auch PoissonVerteilung spielt eine sehr wichtige Rolle, wenn wir explorative Datenanalysen in Data Science mit verschiedenen Tools wie Python, R, Scala usw. durchführen möchten.

 

 


YTube Video: Was ist die Poisson-Verteilung in Statistik und Data Science?

12, 2021