Sökresultat:
12 Uppsatser om CUDA - Sida 1 av 1
Kaijsers algoritm för beräkning av Kantorovichavstånd parallelliserad i CUDA
This thesis processes the work of developing CPU code and GPU code for Thomas Kaijsers algorithm for calculating the kantorovich distance and the performance between the two is compared. Initially there is a rundown of the algorithm which calculates the kantorovich distance between two images. Thereafter we go through the CPU implementation followed by GPGPU written in CUDA. Then the results are presented. Lastly, an analysis about the results and a discussion with possible improvements is presented for possible future applications..
Mikrovågssimulering med realtidsljus : Realtids-ray tracing i CUDA
Detta arbete undersöker möjligheterna med att simulera mikrovågor i ett slutet system. Systemet implementeras med en redan befintlig teknik kallad ray tracing. Ray tracing är en ljussättningsteknik som går ut på att simulera fotoners rörelse mellan ljuskälla och betraktare i en miljö man önskar ljussätta, och sedan belysa de områden som blir träffade för att på detta vis rendera en bild. Fotoner och mikrovågor har egenskaper som liknar varandra då de båda är elektromagnetism med olika våglängder. Ray tracing är en krävande algoritm då många uträkningar för varje foton måste utföras varje uppdatering.
GPU accelerated SPH simulation of fluids for VFX
Fluids are important to the Visual Effects Industry but extremely hard to control and simulate because of the complexity of the governing equations. Fluid solvers can be divided into two categories, those of the Eulerian point of reference and those of the Lagrangian. Both categories have different advantages and weaknesses and hybrid methods are popular. This thesis examines Smoothed Particle Hydrodynamics, a Lagrangian method for physically based uid simulations. To allow the artist the exibility given by shorter simulation times and increased number of iterations, the performance of the solver is key.
Implementation och prestandaanalys av radarsignalbehandlingsalgoritmer på GPU
Det här examensarbetet utvärderar om det är möjligt att använda en eller flera GPUs för att under realtidsförhållanden utföra radarsignalbehandling i ett pulsdopplerradarsystem. En kedja med radarsignalbehandlingsalgoritmer som används för att utföra detektion har implementerats med CUDA och sedan prestandaanalyserats med fokus på låg exekveringstid. Två CFAR-detektionsalgoritmer, CA- och OS-CFAR, har inkluderats i analysen. För CFAR-algoritmerna har flera alternativ formulerats och implementerats för att utvärdera hur de bäst kan anpassas för att exekvera på en GPU.Prestandaanalysen av de implementerade algoritmerna visar att det är möjligt för det tänkta systemet att använda grafikkort för att utföra radarsignalbehandlingen i realtid. Implementationslösningar har presenterats både för CA- och OS-CFAR som uppfyller tidskraven för systemet, i vissa fall med god marginal.
Grafikkort till parallella beräkningar
Den här studien beskriver hur grafikkort kan användas på en bredare front än
multimedia. Arbetet förklarar och diskuterar huvudsakliga alternativ som finns
till att använda grafikkort till generella operationer i dagsläget. Inom denna studie
används Nvidias CUDA arkitektur. Studien beskriver hur grafikkort används
till egna operationer rent praktiskt ur perspektivet att vi redan kan programmera
i högnivåspråk och har grundläggande kunskap om hur en dator fungerar. Vi
använder s.k.
GPGPU-LOD (General Purpose Graphics Processing Unit - Level Of Detail) : Grafikkortsdriven terräng-LOD-algoritm
Dagens grafikkort är uppbyggda av kraftfulla multiprocessorer som gör dom ypperliga för att hantera parallelliserbara problem som skulle ta lång tid att utföra på en vanlig processor, så som exempelvis level-of-detail eller raytracing.Denna rapport presenterar en parallelliserbar level-of-detail algoritm för terränghöjdkartor samt implementerar denna för användning på grafikkort användande Nvidias CUDA API. Algoritmen delar upp den totala höjdkartan i sektioner som ytterligare delas upp i mindre block som beräknas parallellt på grafikkortet. Algoritmen räknar ut vertexpositioner, normaler och texturkoordinater för vardera block och skickar datan till applikationen som skapar vertex och indexbuffertar och renderar sektionerna. Implementationens prestanda och förmåga att reducera trianglar analyseras med två olika sorters culling-metoder; en metod som gallrar trianglar på sektionsnivå och en metod som gallrar på blocknivå.Resultaten visar att det är mycket fördelaktigt att låta grafikkortet hantera level-of-detail beräkningar på detta vis även om minneskopiering över grafikkortsbussen är ett problem, då det tar upp ungefär åttiofem procent av den totala tiden för att hantera en sektion. Beräkningarna i sig tar väldigt lite tid och det finns gott om utrymme för utveckling för att uppnå en så bra fördelningen av trianglar över terrängområdet som möjligt..
Hållbar kapselåtervinningslösning
This thesis processes the work of developing CPU code and GPU code for Thomas Kaijsers algorithm for calculating the kantorovich distance and the performance between the two is compared. Initially there is a rundown of the algorithm which calculates the kantorovich distance between two images. Thereafter we go through the CPU implementation followed by GPGPU written in CUDA. Then the results are presented. Lastly, an analysis about the results and a discussion with possible improvements is presented for possible future applications..
Värdeflödesanalys av en produktionsverkstad
This thesis processes the work of developing CPU code and GPU code for Thomas Kaijsers algorithm for calculating the kantorovich distance and the performance between the two is compared. Initially there is a rundown of the algorithm which calculates the kantorovich distance between two images. Thereafter we go through the CPU implementation followed by GPGPU written in CUDA. Then the results are presented. Lastly, an analysis about the results and a discussion with possible improvements is presented for possible future applications..
Vattenkyld LED-armatur för växthus
This thesis processes the work of developing CPU code and GPU code for Thomas Kaijsers algorithm for calculating the kantorovich distance and the performance between the two is compared. Initially there is a rundown of the algorithm which calculates the kantorovich distance between two images. Thereafter we go through the CPU implementation followed by GPGPU written in CUDA. Then the results are presented. Lastly, an analysis about the results and a discussion with possible improvements is presented for possible future applications..
Mullfilter för avloppsrening ?metodik för funktionssäkring vintertid
This thesis processes the work of developing CPU code and GPU code for Thomas Kaijsers algorithm for calculating the kantorovich distance and the performance between the two is compared. Initially there is a rundown of the algorithm which calculates the kantorovich distance between two images. Thereafter we go through the CPU implementation followed by GPGPU written in CUDA. Then the results are presented. Lastly, an analysis about the results and a discussion with possible improvements is presented for possible future applications..
Strategy and Project analyses- Introduce MacDonald?s in Bangladesh
This thesis processes the work of developing CPU code and GPU code for Thomas Kaijsers algorithm for calculating the kantorovich distance and the performance between the two is compared. Initially there is a rundown of the algorithm which calculates the kantorovich distance between two images. Thereafter we go through the CPU implementation followed by GPGPU written in CUDA. Then the results are presented. Lastly, an analysis about the results and a discussion with possible improvements is presented for possible future applications..
Analys Tarpex Ltd. organisation med logistikröret modell : En fallstudie på Tarpex
This thesis processes the work of developing CPU code and GPU code for Thomas Kaijsers algorithm for calculating the kantorovich distance and the performance between the two is compared. Initially there is a rundown of the algorithm which calculates the kantorovich distance between two images. Thereafter we go through the CPU implementation followed by GPGPU written in CUDA. Then the results are presented. Lastly, an analysis about the results and a discussion with possible improvements is presented for possible future applications..