MCL/sf/mw/qt: src/3rdparty/libjpeg/jidctfst.c@1918ee327afb (annotated)

0 1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	1	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	2	* jidctfst.c
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	3	*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	4	* Copyright (C) 1994-1998, Thomas G. Lane.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	5	* This file is part of the Independent JPEG Group's software.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	6	* For conditions of distribution and use, see the accompanying README file.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	7	*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	8	* This file contains a fast, not so accurate integer implementation of the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	9	* inverse DCT (Discrete Cosine Transform). In the IJG code, this routine
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	10	* must also perform dequantization of the input coefficients.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	11	*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	12	* A 2-D IDCT can be done by 1-D IDCT on each column followed by 1-D IDCT
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	13	* on each row (or vice versa, but it's more convenient to emit a row at
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	14	* a time). Direct algorithms are also available, but they are much more
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	15	* complex and seem not to be any faster when reduced to code.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	16	*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	17	* This implementation is based on Arai, Agui, and Nakajima's algorithm for
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	18	* scaled DCT. Their original paper (Trans. IEICE E-71(11):1095) is in
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	19	* Japanese, but the algorithm is described in the Pennebaker & Mitchell
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	20	* JPEG textbook (see REFERENCES section in file README). The following code
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	21	* is based directly on figure 4-8 in P&M.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	22	* While an 8-point DCT cannot be done in less than 11 multiplies, it is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	23	* possible to arrange the computation so that many of the multiplies are
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	24	* simple scalings of the final outputs. These multiplies can then be
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	25	* folded into the multiplications or divisions by the JPEG quantization
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	26	* table entries. The AA&N method leaves only 5 multiplies and 29 adds
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	27	* to be done in the DCT itself.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	28	* The primary disadvantage of this method is that with fixed-point math,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	29	* accuracy is lost due to imprecise representation of the scaled
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	30	* quantization values. The smaller the quantization table entry, the less
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	31	* precise the scaled value, so this implementation does worse with high-
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	32	* quality-setting files than with low-quality ones.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	33	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	34
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	35	#define JPEG_INTERNALS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	36	#include "jinclude.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	37	#include "jpeglib.h"
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	38	#include "jdct.h" /* Private declarations for DCT subsystem */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	39
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	40	#ifdef DCT_IFAST_SUPPORTED
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	41
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	42
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	43	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	44	* This module is specialized to the case DCTSIZE = 8.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	45	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	46
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	47	#if DCTSIZE != 8
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	48	Sorry, this code only copes with 8x8 DCTs. /* deliberate syntax err */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	49	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	50
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	51
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	52	/* Scaling decisions are generally the same as in the LL&M algorithm;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	53	* see jidctint.c for more details. However, we choose to descale
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	54	* (right shift) multiplication products as soon as they are formed,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	55	* rather than carrying additional fractional bits into subsequent additions.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	56	* This compromises accuracy slightly, but it lets us save a few shifts.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	57	* More importantly, 16-bit arithmetic is then adequate (for 8-bit samples)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	58	* everywhere except in the multiplications proper; this saves a good deal
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	59	* of work on 16-bit-int machines.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	60	*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	61	* The dequantized coefficients are not integers because the AA&N scaling
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	62	* factors have been incorporated. We represent them scaled up by PASS1_BITS,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	63	* so that the first and second IDCT rounds have the same input scaling.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	64	* For 8-bit JSAMPLEs, we choose IFAST_SCALE_BITS = PASS1_BITS so as to
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	65	* avoid a descaling shift; this compromises accuracy rather drastically
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	66	* for small quantization table entries, but it saves a lot of shifts.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	67	* For 12-bit JSAMPLEs, there's no hope of using 16x16 multiplies anyway,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	68	* so we use a much larger scaling factor to preserve accuracy.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	69	*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	70	* A final compromise is to represent the multiplicative constants to only
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	71	* 8 fractional bits, rather than 13. This saves some shifting work on some
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	72	* machines, and may also reduce the cost of multiplication (since there
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	73	* are fewer one-bits in the constants).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	74	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	75
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	76	#if BITS_IN_JSAMPLE == 8
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	77	#define CONST_BITS 8
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	78	#define PASS1_BITS 2
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	79	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	80	#define CONST_BITS 8
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	81	#define PASS1_BITS 1 /* lose a little precision to avoid overflow */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	82	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	83
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	84	/* Some C compilers fail to reduce "FIX(constant)" at compile time, thus
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	85	* causing a lot of useless floating-point operations at run time.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	86	* To get around this we use the following pre-calculated constants.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	87	* If you change CONST_BITS you may want to add appropriate values.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	88	* (With a reasonable C compiler, you can just rely on the FIX() macro...)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	89	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	90
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	91	#if CONST_BITS == 8
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	92	#define FIX_1_082392200 ((INT32) 277) /* FIX(1.082392200) */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	93	#define FIX_1_414213562 ((INT32) 362) /* FIX(1.414213562) */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	94	#define FIX_1_847759065 ((INT32) 473) /* FIX(1.847759065) */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	95	#define FIX_2_613125930 ((INT32) 669) /* FIX(2.613125930) */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	96	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	97	#define FIX_1_082392200 FIX(1.082392200)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	98	#define FIX_1_414213562 FIX(1.414213562)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	99	#define FIX_1_847759065 FIX(1.847759065)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	100	#define FIX_2_613125930 FIX(2.613125930)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	101	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	102
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	103
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	104	/* We can gain a little more speed, with a further compromise in accuracy,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	105	* by omitting the addition in a descaling shift. This yields an incorrectly
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	106	* rounded result half the time...
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	107	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	108
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	109	#ifndef USE_ACCURATE_ROUNDING
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	110	#undef DESCALE
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	111	#define DESCALE(x,n) RIGHT_SHIFT(x, n)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	112	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	113
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	114
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	115	/* Multiply a DCTELEM variable by an INT32 constant, and immediately
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	116	* descale to yield a DCTELEM result.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	117	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	118
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	119	#define MULTIPLY(var,const) ((DCTELEM) DESCALE((var) * (const), CONST_BITS))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	120
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	121
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	122	/* Dequantize a coefficient by multiplying it by the multiplier-table
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	123	* entry; produce a DCTELEM result. For 8-bit data a 16x16->16
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	124	* multiplication will do. For 12-bit data, the multiplier table is
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	125	* declared INT32, so a 32-bit multiply will be used.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	126	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	127
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	128	#if BITS_IN_JSAMPLE == 8
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	129	#define DEQUANTIZE(coef,quantval) (((IFAST_MULT_TYPE) (coef)) * (quantval))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	130	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	131	#define DEQUANTIZE(coef,quantval) \
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	132	DESCALE((coef)*(quantval), IFAST_SCALE_BITS-PASS1_BITS)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	133	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	134
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	135
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	136	/* Like DESCALE, but applies to a DCTELEM and produces an int.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	137	* We assume that int right shift is unsigned if INT32 right shift is.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	138	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	139
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	140	#ifdef RIGHT_SHIFT_IS_UNSIGNED
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	141	#define ISHIFT_TEMPS DCTELEM ishift_temp;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	142	#if BITS_IN_JSAMPLE == 8
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	143	#define DCTELEMBITS 16 /* DCTELEM may be 16 or 32 bits */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	144	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	145	#define DCTELEMBITS 32 /* DCTELEM must be 32 bits */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	146	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	147	#define IRIGHT_SHIFT(x,shft) \
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	148	((ishift_temp = (x)) < 0 ? \
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	149	(ishift_temp >> (shft)) \| ((~((DCTELEM) 0)) << (DCTELEMBITS-(shft))) : \
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	150	(ishift_temp >> (shft)))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	151	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	152	#define ISHIFT_TEMPS
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	153	#define IRIGHT_SHIFT(x,shft) ((x) >> (shft))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	154	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	155
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	156	#ifdef USE_ACCURATE_ROUNDING
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	157	#define IDESCALE(x,n) ((int) IRIGHT_SHIFT((x) + (1 << ((n)-1)), n))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	158	#else
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	159	#define IDESCALE(x,n) ((int) IRIGHT_SHIFT(x, n))
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	160	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	161
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	162
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	163	/*
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	164	* Perform dequantization and inverse DCT on one block of coefficients.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	165	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	166
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	167	GLOBAL(void)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	168	jpeg_idct_ifast (j_decompress_ptr cinfo, jpeg_component_info * compptr,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	169	JCOEFPTR coef_block,
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	170	JSAMPARRAY output_buf, JDIMENSION output_col)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	171	{
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	172	DCTELEM tmp0, tmp1, tmp2, tmp3, tmp4, tmp5, tmp6, tmp7;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	173	DCTELEM tmp10, tmp11, tmp12, tmp13;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	174	DCTELEM z5, z10, z11, z12, z13;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	175	JCOEFPTR inptr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	176	IFAST_MULT_TYPE * quantptr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	177	int * wsptr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	178	JSAMPROW outptr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	179	JSAMPLE *range_limit = IDCT_range_limit(cinfo);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	180	int ctr;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	181	int workspace[DCTSIZE2]; /* buffers data between passes */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	182	SHIFT_TEMPS /* for DESCALE */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	183	ISHIFT_TEMPS /* for IDESCALE */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	184
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	185	/* Pass 1: process columns from input, store into work array. */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	186
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	187	inptr = coef_block;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	188	quantptr = (IFAST_MULT_TYPE *) compptr->dct_table;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	189	wsptr = workspace;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	190	for (ctr = DCTSIZE; ctr > 0; ctr--) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	191	/* Due to quantization, we will usually find that many of the input
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	192	* coefficients are zero, especially the AC terms. We can exploit this
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	193	* by short-circuiting the IDCT calculation for any column in which all
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	194	* the AC terms are zero. In that case each output is equal to the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	195	* DC coefficient (with scale factor as needed).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	196	* With typical images and quantization tables, half or more of the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	197	* column DCT calculations can be simplified this way.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	198	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	199
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	200	if (inptr[DCTSIZE1] == 0 && inptr[DCTSIZE2] == 0 &&
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	201	inptr[DCTSIZE3] == 0 && inptr[DCTSIZE4] == 0 &&
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	202	inptr[DCTSIZE5] == 0 && inptr[DCTSIZE6] == 0 &&
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	203	inptr[DCTSIZE*7] == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	204	/* AC terms all zero */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	205	int dcval = (int) DEQUANTIZE(inptr[DCTSIZE0], quantptr[DCTSIZE0]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	206
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	207	wsptr[DCTSIZE*0] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	208	wsptr[DCTSIZE*1] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	209	wsptr[DCTSIZE*2] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	210	wsptr[DCTSIZE*3] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	211	wsptr[DCTSIZE*4] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	212	wsptr[DCTSIZE*5] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	213	wsptr[DCTSIZE*6] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	214	wsptr[DCTSIZE*7] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	215
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	216	inptr++; /* advance pointers to next column */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	217	quantptr++;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	218	wsptr++;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	219	continue;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	220	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	221
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	222	/* Even part */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	223
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	224	tmp0 = DEQUANTIZE(inptr[DCTSIZE0], quantptr[DCTSIZE0]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	225	tmp1 = DEQUANTIZE(inptr[DCTSIZE2], quantptr[DCTSIZE2]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	226	tmp2 = DEQUANTIZE(inptr[DCTSIZE4], quantptr[DCTSIZE4]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	227	tmp3 = DEQUANTIZE(inptr[DCTSIZE6], quantptr[DCTSIZE6]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	228
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	229	tmp10 = tmp0 + tmp2; /* phase 3 */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	230	tmp11 = tmp0 - tmp2;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	231
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	232	tmp13 = tmp1 + tmp3; /* phases 5-3 */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	233	tmp12 = MULTIPLY(tmp1 - tmp3, FIX_1_414213562) - tmp13; /* 2c4 /
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	234
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	235	tmp0 = tmp10 + tmp13; /* phase 2 */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	236	tmp3 = tmp10 - tmp13;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	237	tmp1 = tmp11 + tmp12;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	238	tmp2 = tmp11 - tmp12;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	239
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	240	/* Odd part */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	241
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	242	tmp4 = DEQUANTIZE(inptr[DCTSIZE1], quantptr[DCTSIZE1]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	243	tmp5 = DEQUANTIZE(inptr[DCTSIZE3], quantptr[DCTSIZE3]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	244	tmp6 = DEQUANTIZE(inptr[DCTSIZE5], quantptr[DCTSIZE5]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	245	tmp7 = DEQUANTIZE(inptr[DCTSIZE7], quantptr[DCTSIZE7]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	246
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	247	z13 = tmp6 + tmp5; /* phase 6 */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	248	z10 = tmp6 - tmp5;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	249	z11 = tmp4 + tmp7;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	250	z12 = tmp4 - tmp7;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	251
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	252	tmp7 = z11 + z13; /* phase 5 */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	253	tmp11 = MULTIPLY(z11 - z13, FIX_1_414213562); /* 2c4 /
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	254
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	255	z5 = MULTIPLY(z10 + z12, FIX_1_847759065); /* 2c2 /
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	256	tmp10 = MULTIPLY(z12, FIX_1_082392200) - z5; /* 2(c2-c6) /
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	257	tmp12 = MULTIPLY(z10, - FIX_2_613125930) + z5; /* -2(c2+c6) /
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	258
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	259	tmp6 = tmp12 - tmp7; /* phase 2 */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	260	tmp5 = tmp11 - tmp6;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	261	tmp4 = tmp10 + tmp5;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	262
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	263	wsptr[DCTSIZE*0] = (int) (tmp0 + tmp7);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	264	wsptr[DCTSIZE*7] = (int) (tmp0 - tmp7);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	265	wsptr[DCTSIZE*1] = (int) (tmp1 + tmp6);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	266	wsptr[DCTSIZE*6] = (int) (tmp1 - tmp6);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	267	wsptr[DCTSIZE*2] = (int) (tmp2 + tmp5);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	268	wsptr[DCTSIZE*5] = (int) (tmp2 - tmp5);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	269	wsptr[DCTSIZE*4] = (int) (tmp3 + tmp4);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	270	wsptr[DCTSIZE*3] = (int) (tmp3 - tmp4);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	271
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	272	inptr++; /* advance pointers to next column */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	273	quantptr++;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	274	wsptr++;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	275	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	276
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	277	/* Pass 2: process rows from work array, store into output array. */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	278	/* Note that we must descale the results by a factor of 8 == 2*3, /
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	279	/* and also undo the PASS1_BITS scaling. */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	280
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	281	wsptr = workspace;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	282	for (ctr = 0; ctr < DCTSIZE; ctr++) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	283	outptr = output_buf[ctr] + output_col;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	284	/* Rows of zeroes can be exploited in the same way as we did with columns.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	285	* However, the column calculation has created many nonzero AC terms, so
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	286	* the simplification applies less often (typically 5% to 10% of the time).
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	287	* On machines with very fast multiplication, it's possible that the
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	288	* test takes more time than it's worth. In that case this section
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	289	* may be commented out.
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	290	*/
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	291
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	292	#ifndef NO_ZERO_ROW_TEST
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	293	if (wsptr[1] == 0 && wsptr[2] == 0 && wsptr[3] == 0 && wsptr[4] == 0 &&
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	294	wsptr[5] == 0 && wsptr[6] == 0 && wsptr[7] == 0) {
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	295	/* AC terms all zero */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	296	JSAMPLE dcval = range_limit[IDESCALE(wsptr[0], PASS1_BITS+3)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	297	& RANGE_MASK];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	298
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	299	outptr[0] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	300	outptr[1] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	301	outptr[2] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	302	outptr[3] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	303	outptr[4] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	304	outptr[5] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	305	outptr[6] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	306	outptr[7] = dcval;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	307
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	308	wsptr += DCTSIZE; /* advance pointer to next row */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	309	continue;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	310	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	311	#endif
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	312
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	313	/* Even part */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	314
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	315	tmp10 = ((DCTELEM) wsptr[0] + (DCTELEM) wsptr[4]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	316	tmp11 = ((DCTELEM) wsptr[0] - (DCTELEM) wsptr[4]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	317
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	318	tmp13 = ((DCTELEM) wsptr[2] + (DCTELEM) wsptr[6]);
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	319	tmp12 = MULTIPLY((DCTELEM) wsptr[2] - (DCTELEM) wsptr[6], FIX_1_414213562)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	320	- tmp13;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	321
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	322	tmp0 = tmp10 + tmp13;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	323	tmp3 = tmp10 - tmp13;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	324	tmp1 = tmp11 + tmp12;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	325	tmp2 = tmp11 - tmp12;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	326
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	327	/* Odd part */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	328
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	329	z13 = (DCTELEM) wsptr[5] + (DCTELEM) wsptr[3];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	330	z10 = (DCTELEM) wsptr[5] - (DCTELEM) wsptr[3];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	331	z11 = (DCTELEM) wsptr[1] + (DCTELEM) wsptr[7];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	332	z12 = (DCTELEM) wsptr[1] - (DCTELEM) wsptr[7];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	333
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	334	tmp7 = z11 + z13; /* phase 5 */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	335	tmp11 = MULTIPLY(z11 - z13, FIX_1_414213562); /* 2c4 /
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	336
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	337	z5 = MULTIPLY(z10 + z12, FIX_1_847759065); /* 2c2 /
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	338	tmp10 = MULTIPLY(z12, FIX_1_082392200) - z5; /* 2(c2-c6) /
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	339	tmp12 = MULTIPLY(z10, - FIX_2_613125930) + z5; /* -2(c2+c6) /
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	340
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	341	tmp6 = tmp12 - tmp7; /* phase 2 */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	342	tmp5 = tmp11 - tmp6;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	343	tmp4 = tmp10 + tmp5;
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	344
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	345	/* Final output stage: scale down by a factor of 8 and range-limit */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	346
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	347	outptr[0] = range_limit[IDESCALE(tmp0 + tmp7, PASS1_BITS+3)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	348	& RANGE_MASK];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	349	outptr[7] = range_limit[IDESCALE(tmp0 - tmp7, PASS1_BITS+3)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	350	& RANGE_MASK];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	351	outptr[1] = range_limit[IDESCALE(tmp1 + tmp6, PASS1_BITS+3)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	352	& RANGE_MASK];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	353	outptr[6] = range_limit[IDESCALE(tmp1 - tmp6, PASS1_BITS+3)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	354	& RANGE_MASK];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	355	outptr[2] = range_limit[IDESCALE(tmp2 + tmp5, PASS1_BITS+3)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	356	& RANGE_MASK];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	357	outptr[5] = range_limit[IDESCALE(tmp2 - tmp5, PASS1_BITS+3)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	358	& RANGE_MASK];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	359	outptr[4] = range_limit[IDESCALE(tmp3 + tmp4, PASS1_BITS+3)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	360	& RANGE_MASK];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	361	outptr[3] = range_limit[IDESCALE(tmp3 - tmp4, PASS1_BITS+3)
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	362	& RANGE_MASK];
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	363
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	364	wsptr += DCTSIZE; /* advance pointer to next row */
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	365	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	366	}
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	367
1918ee327afb Revision: 200952 Alex Gilkes <alex.gilkes@nokia.com> parents: diff changeset	368	#endif /* DCT_IFAST_SUPPORTED */

author	Alex Gilkes <alex.gilkes@nokia.com>
	Mon, 11 Jan 2010 14:00:40 +0000
changeset 0	1918ee327afb
permissions	-rw-r--r--