Skip to content
GitLab
Projects
Groups
Snippets
Help
Loading...
Help
What's new
7
Help
Support
Community forum
Keyboard shortcuts
?
Submit feedback
Contribute to GitLab
Sign in
Toggle navigation
Open sidebar
advanced_computer_architecture
exercises
Commits
95a7cd98
Commit
95a7cd98
authored
Jun 17, 2016
by
Christoph Gerum
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
Add code highlighting for exercise 5
parent
02dc26ed
Changes
1
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
5 additions
and
4 deletions
+5
-4
aufgaben/blatt05/blatt05.md
aufgaben/blatt05/blatt05.md
+5
-4
No files found.
aufgaben/blatt05/blatt05.md
View file @
95a7cd98
Title: Blatt
4
Title: Blatt
5
status: hidden
# Superlinearer Speedup und Vektorbefehle
...
...
@@ -66,7 +66,7 @@ Neon-Funktionalität zu benutzen.
In dem Programm *neon_convert.c* wurde eine Funktion zur Konvertierung
von Farbbildern in Graustufen einmal wie im folgenden in reinem C implementiert
```c
void reference_convert (uint8_t * __restrict dest, uint8_t * __restrict src, int n){
int i;
for (i=0; i<n; i++){
...
...
@@ -81,13 +81,14 @@ von Farbbildern in Graustufen einmal wie im folgenden in reinem C implementiert
*dest++ = (y>>8);
}
}
```
Und einmal mit neon intrinsics implementiert.
```c
void neon_convert (uint8_t * __restrict dest, uint8_t * __restrict src, int n){
int i;
uint8x8_t rfac = vdup_n_u8 (77);
...
...
@@ -110,7 +111,7 @@ Und einmal mit neon intrinsics implementiert.
dest += 8;
}
}
``
`
Ihre Aufgabe ist es nun die beiden implementierungen miteinander zu vergleichen und den Effekt von Pipelinebreiten und Compileroptimierungen auf
die Performance der implementierungen zu untersuchen. Übersetzen sie das Programm für den Simulator verwenden sie dazu die folgende Kommandozeile:
...
...
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
.
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment