Skip to content

Commit

Permalink
arm: Don't clobber callee saved registers in scalarproduct
Browse files Browse the repository at this point in the history
q4-q7/d8-d15 are supposed to not be clobbered by the callee.

CC: [email protected]
Signed-off-by: Martin Storsjö <[email protected]>
  • Loading branch information
mstorsjo committed Dec 20, 2013
1 parent 5c3fa74 commit d307e40
Showing 1 changed file with 6 additions and 6 deletions.
12 changes: 6 additions & 6 deletions libavcodec/arm/int_neon.S
Original file line number Diff line number Diff line change
Expand Up @@ -41,10 +41,10 @@ function ff_scalarproduct_int16_neon, export=1

vpadd.s32 d16, d0, d1
vpadd.s32 d17, d2, d3
vpadd.s32 d10, d4, d5
vpadd.s32 d11, d6, d7
vpadd.s32 d18, d4, d5
vpadd.s32 d19, d6, d7
vpadd.s32 d0, d16, d17
vpadd.s32 d1, d10, d11
vpadd.s32 d1, d18, d19
vpadd.s32 d2, d0, d1
vpaddl.s32 d3, d2
vmov.32 r0, d3[0]
Expand Down Expand Up @@ -81,10 +81,10 @@ function ff_scalarproduct_and_madd_int16_neon, export=1

vpadd.s32 d16, d0, d1
vpadd.s32 d17, d2, d3
vpadd.s32 d10, d4, d5
vpadd.s32 d11, d6, d7
vpadd.s32 d18, d4, d5
vpadd.s32 d19, d6, d7
vpadd.s32 d0, d16, d17
vpadd.s32 d1, d10, d11
vpadd.s32 d1, d18, d19
vpadd.s32 d2, d0, d1
vpaddl.s32 d3, d2
vmov.32 r0, d3[0]
Expand Down

0 comments on commit d307e40

Please sign in to comment.