Klusteranalys av cykelflödesdata för identifiering av viktiga faktorer och avvikande datapunkter

DSpace Repository

Klusteranalys av cykelflödesdata för identifiering av viktiga faktorer och avvikande datapunkter

Details

Files for download
Icon
Overview of item record
Publication Bachelor thesis
Title Klusteranalys av cykelflödesdata för identifiering av viktiga faktorer och avvikande datapunkter
Author Hojeij, Mohamed ; Tram, Alex
Date 2019
English abstract
This study aims to provide a deeper understanding of the different factors and their impact on the bicycle flow in Malmö during a certain day. We mainly examined the questions, what is the most optimal number of clusters needed in order to identify discrepancies, and which key factors have huge impact in a dataset? The choice of the method used in this study is a matching approach based on experiment together with an evaluation method. The work method occurred in an iterative process, where the experiment was conducted to find the right number of clusters and the evaluation was the analysing of the results that were produced by the experiment. The collected data from a bicycle counter, located in Kaptensgatan in Malmö, had to be processed with normalization to ensure that the volume of the bicycles does not affect the study. The purpose of our study is to identify discrepancies and key factors that have huge implications on the bicycle flow with the help of cluster analysis that might lead to more well-informed decision in urban planning and transportation planning. If it were possible to analyze cyclists where these factors are eliminated, this would lead to further development and research of great importance for Malmö City. By using the cluster algorithm K-means, and Euclidean distance, which is used as calculation of distances in similar areas, we could then find relevant clusters with deviating data points and key factors with great impact on the bicycle flow. Our results shows that 7 clusters, 2 of which were divided up to 6 smaller clusters, were the most optimal for the study and the factors with a large impact on the number-registered cyclists during certain days could then be best identified. The factors identified were events, festivals, football matches, concerts, rainfalls and holidays.
Swedish abstract
Studien har för avsikt att förbättra kunskapen om vilka faktorer som påverkar cykelflödet en viss dag i Malmö. Vi har huvudsakligen undersökt frågor om, hur många grupperande kluster är optimalt för att kunna identifiera avvikande dagar och vilka är dess faktorer i en tidsserie cykelvolymdata? Vår arbetsmetod var att använda ett matchande tillvägagångssätt baserat på ett experiment tillsammans med en utvärderingsmetod. Arbetsmetoden skedde i en iterativ process där experimentet var att hitta rätt antal kluster och där utvärderingen var analysen av resultaten som producerades av experimentet. Datan erhållen från en cykelräknare belägen på Kaptensgatan i Malmö fick databearbetas med hjälp av normalisering då volymen av cyklister inte ska ha någon påverkan i studien. Syftet med vårt arbete är att kunna identifiera avvikande datapunkter och dess faktorer med stor inverkan på cykelflöden med hjälp av klusteranalys då detta kan leda till mer välinformerade beslut vid stads- och transportplanering. Om det gick att analysera cyklister där dessa faktorer elimineras så skulle detta leda till vidare utveckling och forskning av stor betydelse för Malmö stad. Genom att använda oss av klusteranalysen K-means och Euklidisk distans som används som beräkning av distanser inom liknande områden kunde vi finna relevanta kluster med avvikande datapunkter och faktorer med stor inverkan på cykelflödet. Vårt resultat visar att 7 kluster varav 2 av de delades upp till 6 mindre kluster, var det mest optimala för studien och faktorerna med en stor inverkan på de antal registrerade cyklisterna under vissa dagar kunde då identifieras bäst. Faktorerna som identifierades var evenemang, festivaler, fotbollsmatcher, konserter, lovdagar, nederbörd och röda dagar.
Publisher Malmö universitet/Teknik och samhälle
Language swe (iso)
Subject Klusteranalys
K-Means
Cykeldata
Maskininlärning
Handle http://hdl.handle.net/2043/29101 Permalink to this page
Facebook

This item appears in the following Collection(s)

Details

Search


Browse

My Account

Statistics