linux/Documentation/atomic_t.txt

706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraOn atomic types (atomic_t atomic64_t and atomic_long_t).
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraThe atomic type provides an interface to the architecture's means of atomic
706eeb3eSPeter ZijlstraRMW operations between CPUs (atomic operations on MMIO are not supported and
706eeb3eSPeter Zijlstracan lead to fatal traps on some platforms).
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraAPI
706eeb3eSPeter Zijlstra---
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraThe 'full' API consists of (atomic64_ and atomic_long_ prefixes omitted for
706eeb3eSPeter Zijlstrabrevity):
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraNon-RMW ops:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  atomic_read(), atomic_set()
706eeb3eSPeter Zijlstra  atomic_read_acquire(), atomic_set_release()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraRMW atomic operations:
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraArithmetic:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  atomic_{add,sub,inc,dec}()
706eeb3eSPeter Zijlstra  atomic_{add,sub,inc,dec}_return{,_relaxed,_acquire,_release}()
706eeb3eSPeter Zijlstra  atomic_fetch_{add,sub,inc,dec}{,_relaxed,_acquire,_release}()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraBitwise:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  atomic_{and,or,xor,andnot}()
706eeb3eSPeter Zijlstra  atomic_fetch_{and,or,xor,andnot}{,_relaxed,_acquire,_release}()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraSwap:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  atomic_xchg{,_relaxed,_acquire,_release}()
706eeb3eSPeter Zijlstra  atomic_cmpxchg{,_relaxed,_acquire,_release}()
706eeb3eSPeter Zijlstra  atomic_try_cmpxchg{,_relaxed,_acquire,_release}()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraReference count (but please see refcount_t):
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  atomic_add_unless(), atomic_inc_not_zero()
706eeb3eSPeter Zijlstra  atomic_sub_and_test(), atomic_dec_and_test()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraMisc:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  atomic_inc_and_test(), atomic_add_negative()
706eeb3eSPeter Zijlstra  atomic_dec_unless_positive(), atomic_inc_unless_negative()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraBarriers:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  smp_mb__{before,after}_atomic()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra
f1887143SPeter ZijlstraTYPES (signed vs unsigned)
f1887143SPeter Zijlstra-----
f1887143SPeter Zijlstra
f1887143SPeter ZijlstraWhile atomic_t, atomic_long_t and atomic64_t use int, long and s64
f1887143SPeter Zijlstrarespectively (for hysterical raisins), the kernel uses -fno-strict-overflow
f1887143SPeter Zijlstra(which implies -fwrapv) and defines signed overflow to behave like
f1887143SPeter Zijlstra2s-complement.
f1887143SPeter Zijlstra
f1887143SPeter ZijlstraTherefore, an explicitly unsigned variant of the atomic ops is strictly
f1887143SPeter Zijlstraunnecessary and we can simply cast, there is no UB.
f1887143SPeter Zijlstra
f1887143SPeter ZijlstraThere was a bug in UBSAN prior to GCC-8 that would generate UB warnings for
f1887143SPeter Zijlstrasigned types.
f1887143SPeter Zijlstra
f1887143SPeter ZijlstraWith this we also conform to the C/C++ _Atomic behaviour and things like
f1887143SPeter ZijlstraP1236R1.
f1887143SPeter Zijlstra
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraSEMANTICS
706eeb3eSPeter Zijlstra---------
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraNon-RMW ops:
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraThe non-RMW ops are (typically) regular LOADs and STOREs and are canonically
706eeb3eSPeter Zijlstraimplemented using READ_ONCE(), WRITE_ONCE(), smp_load_acquire() and
fff9b6c7SPeter Zijlstrasmp_store_release() respectively. Therefore, if you find yourself only using
fff9b6c7SPeter Zijlstrathe Non-RMW operations of atomic_t, you do not in fact need atomic_t at all
fff9b6c7SPeter Zijlstraand are doing it wrong.
706eeb3eSPeter Zijlstra
4dcd4d36SBoqun FengA note for the implementation of atomic_set{}() is that it must not break the
4dcd4d36SBoqun Fengatomicity of the RMW ops. That is:
706eeb3eSPeter Zijlstra
4dcd4d36SBoqun Feng  C Atomic-RMW-ops-are-atomic-WRT-atomic_set
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  {
4dcd4d36SBoqun Feng    atomic_t v = ATOMIC_INIT(1);
4dcd4d36SBoqun Feng  }
4dcd4d36SBoqun Feng
4dcd4d36SBoqun Feng  P0(atomic_t *v)
4dcd4d36SBoqun Feng  {
4dcd4d36SBoqun Feng    (void)atomic_add_unless(v, 1, 0);
706eeb3eSPeter Zijlstra  }
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  P1(atomic_t *v)
706eeb3eSPeter Zijlstra  {
706eeb3eSPeter Zijlstra    atomic_set(v, 0);
706eeb3eSPeter Zijlstra  }
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  exists
706eeb3eSPeter Zijlstra  (v=2)
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraIn this case we would expect the atomic_set() from CPU1 to either happen
706eeb3eSPeter Zijlstrabefore the atomic_add_unless(), in which case that latter one would no-op, or
706eeb3eSPeter Zijlstra_after_ in which case we'd overwrite its result. In no case is "2" a valid
706eeb3eSPeter Zijlstraoutcome.
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraThis is typically true on 'normal' platforms, where a regular competing STORE
706eeb3eSPeter Zijlstrawill invalidate a LL/SC or fail a CMPXCHG.
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraThe obvious case where this is not so is when we need to implement atomic ops
706eeb3eSPeter Zijlstrawith a lock:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  CPU0						CPU1
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  atomic_add_unless(v, 1, 0);
706eeb3eSPeter Zijlstra    lock();
706eeb3eSPeter Zijlstra    ret = READ_ONCE(v->counter); // == 1
706eeb3eSPeter Zijlstra						atomic_set(v, 0);
706eeb3eSPeter Zijlstra    if (ret != u)				  WRITE_ONCE(v->counter, 0);
706eeb3eSPeter Zijlstra      WRITE_ONCE(v->counter, ret + 1);
706eeb3eSPeter Zijlstra    unlock();
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstrathe typical solution is to then implement atomic_set{}() with atomic_xchg().
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraRMW ops:
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraThese come in various forms:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra - plain operations without return value: atomic_{}()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra - operations which return the modified value: atomic_{}_return()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra   these are limited to the arithmetic operations because those are
706eeb3eSPeter Zijlstra   reversible. Bitops are irreversible and therefore the modified value
706eeb3eSPeter Zijlstra   is of dubious utility.
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra - operations which return the original value: atomic_fetch_{}()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra - swap operations: xchg(), cmpxchg() and try_cmpxchg()
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra - misc; the special purpose operations that are commonly used and would,
706eeb3eSPeter Zijlstra   given the interface, normally be implemented using (try_)cmpxchg loops but
706eeb3eSPeter Zijlstra   are time critical and can, (typically) on LL/SC architectures, be more
706eeb3eSPeter Zijlstra   efficiently implemented.
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraAll these operations are SMP atomic; that is, the operations (for a single
706eeb3eSPeter Zijlstraatomic variable) can be fully ordered and no intermediate state is lost or
706eeb3eSPeter Zijlstravisible.
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraORDERING  (go read memory-barriers.txt first)
706eeb3eSPeter Zijlstra--------
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraThe rule of thumb:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra - non-RMW operations are unordered;
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra - RMW operations that have no return value are unordered;
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra - RMW operations that have a return value are fully ordered;
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra - RMW operations that are conditional are unordered on FAILURE,
706eeb3eSPeter Zijlstra   otherwise the above rules apply.
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraExcept of course when an operation has an explicit ordering like:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra {}_relaxed: unordered
706eeb3eSPeter Zijlstra {}_acquire: the R of the RMW (or atomic_read) is an ACQUIRE
706eeb3eSPeter Zijlstra {}_release: the W of the RMW (or atomic_set)  is a  RELEASE
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraWhere 'unordered' is against other memory locations. Address dependencies are
706eeb3eSPeter Zijlstranot defeated.
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraFully ordered primitives are ordered against everything prior and everything
706eeb3eSPeter Zijlstrasubsequent. Therefore a fully ordered primitive is like having an smp_mb()
706eeb3eSPeter Zijlstrabefore and an smp_mb() after the primitive.
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraThe barriers:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  smp_mb__{before,after}_atomic()
706eeb3eSPeter Zijlstra
2966f8d4SAlan Sternonly apply to the RMW atomic ops and can be used to augment/upgrade the
2966f8d4SAlan Sternordering inherent to the op. These barriers act almost like a full smp_mb():
2966f8d4SAlan Sternsmp_mb__before_atomic() orders all earlier accesses against the RMW op
2966f8d4SAlan Sternitself and all accesses following it, and smp_mb__after_atomic() orders all
2966f8d4SAlan Sternlater accesses against the RMW op and all accesses preceding it. However,
2966f8d4SAlan Sternaccesses between the smp_mb__{before,after}_atomic() and the RMW op are not
2966f8d4SAlan Sternordered, so it is advisable to place the barrier right next to the RMW atomic
2966f8d4SAlan Sternop whenever possible.
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraThese helper barriers exist because architectures have varying implicit
706eeb3eSPeter Zijlstraordering on their SMP atomic primitives. For example our TSO architectures
706eeb3eSPeter Zijlstraprovide full ordered atomics and these barriers are no-ops.
706eeb3eSPeter Zijlstra
69d927bbSPeter ZijlstraNOTE: when the atomic RmW ops are fully ordered, they should also imply a
69d927bbSPeter Zijlstracompiler barrier.
69d927bbSPeter Zijlstra
706eeb3eSPeter ZijlstraThus:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  atomic_fetch_add();
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstrais equivalent to:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  smp_mb__before_atomic();
706eeb3eSPeter Zijlstra  atomic_fetch_add_relaxed();
706eeb3eSPeter Zijlstra  smp_mb__after_atomic();
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraHowever the atomic_fetch_add() might be implemented more efficiently.
706eeb3eSPeter Zijlstra
706eeb3eSPeter ZijlstraFurther, while something like:
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstra  smp_mb__before_atomic();
706eeb3eSPeter Zijlstra  atomic_dec(&X);
706eeb3eSPeter Zijlstra
706eeb3eSPeter Zijlstrais a 'typical' RELEASE pattern, the barrier is strictly stronger than
2966f8d4SAlan Sterna RELEASE because it orders preceding instructions against both the read
2966f8d4SAlan Sternand write parts of the atomic_dec(), and against all following instructions
2966f8d4SAlan Sternas well. Similarly, something like:
706eeb3eSPeter Zijlstra
ca110694SPeter Zijlstra  atomic_inc(&X);
ca110694SPeter Zijlstra  smp_mb__after_atomic();
706eeb3eSPeter Zijlstra
ca110694SPeter Zijlstrais an ACQUIRE pattern (though very much not typical), but again the barrier is
ca110694SPeter Zijlstrastrictly stronger than ACQUIRE. As illustrated:
ca110694SPeter Zijlstra
e30d0235SBoqun Feng  C Atomic-RMW+mb__after_atomic-is-stronger-than-acquire
ca110694SPeter Zijlstra
ca110694SPeter Zijlstra  {
ca110694SPeter Zijlstra  }
ca110694SPeter Zijlstra
e30d0235SBoqun Feng  P0(int *x, atomic_t *y)
ca110694SPeter Zijlstra  {
ca110694SPeter Zijlstra    r0 = READ_ONCE(*x);
ca110694SPeter Zijlstra    smp_rmb();
ca110694SPeter Zijlstra    r1 = atomic_read(y);
ca110694SPeter Zijlstra  }
ca110694SPeter Zijlstra
e30d0235SBoqun Feng  P1(int *x, atomic_t *y)
ca110694SPeter Zijlstra  {
ca110694SPeter Zijlstra    atomic_inc(y);
ca110694SPeter Zijlstra    smp_mb__after_atomic();
ca110694SPeter Zijlstra    WRITE_ONCE(*x, 1);
ca110694SPeter Zijlstra  }
ca110694SPeter Zijlstra
ca110694SPeter Zijlstra  exists
e30d0235SBoqun Feng  (0:r0=1 /\ 0:r1=0)
ca110694SPeter Zijlstra
ca110694SPeter ZijlstraThis should not happen; but a hypothetical atomic_inc_acquire() --
ca110694SPeter Zijlstra(void)atomic_fetch_inc_acquire() for instance -- would allow the outcome,
2966f8d4SAlan Sternbecause it would not order the W part of the RMW against the following
2966f8d4SAlan SternWRITE_ONCE.  Thus:
ca110694SPeter Zijlstra
e30d0235SBoqun Feng  P0			P1
ca110694SPeter Zijlstra
ca110694SPeter Zijlstra			t = LL.acq *y (0)
ca110694SPeter Zijlstra			t++;
ca110694SPeter Zijlstra			*x = 1;
ca110694SPeter Zijlstra  r0 = *x (1)
ca110694SPeter Zijlstra  RMB
ca110694SPeter Zijlstra  r1 = *y (0)
ca110694SPeter Zijlstra			SC *y, t;
ca110694SPeter Zijlstra
ca110694SPeter Zijlstrais allowed.
d1bbfd0cSPeter Zijlstra
d1bbfd0cSPeter Zijlstra
d1bbfd0cSPeter ZijlstraCMPXCHG vs TRY_CMPXCHG
d1bbfd0cSPeter Zijlstra----------------------
d1bbfd0cSPeter Zijlstra
d1bbfd0cSPeter Zijlstra  int atomic_cmpxchg(atomic_t *ptr, int old, int new);
d1bbfd0cSPeter Zijlstra  bool atomic_try_cmpxchg(atomic_t *ptr, int *oldp, int new);
d1bbfd0cSPeter Zijlstra
d1bbfd0cSPeter ZijlstraBoth provide the same functionality, but try_cmpxchg() can lead to more
d1bbfd0cSPeter Zijlstracompact code. The functions relate like:
d1bbfd0cSPeter Zijlstra
d1bbfd0cSPeter Zijlstra  bool atomic_try_cmpxchg(atomic_t *ptr, int *oldp, int new)
d1bbfd0cSPeter Zijlstra  {
d1bbfd0cSPeter Zijlstra    int ret, old = *oldp;
d1bbfd0cSPeter Zijlstra    ret = atomic_cmpxchg(ptr, old, new);
d1bbfd0cSPeter Zijlstra    if (ret != old)
d1bbfd0cSPeter Zijlstra      *oldp = ret;
d1bbfd0cSPeter Zijlstra    return ret == old;
d1bbfd0cSPeter Zijlstra  }
d1bbfd0cSPeter Zijlstra
d1bbfd0cSPeter Zijlstraand:
d1bbfd0cSPeter Zijlstra
d1bbfd0cSPeter Zijlstra  int atomic_cmpxchg(atomic_t *ptr, int old, int new)
d1bbfd0cSPeter Zijlstra  {
d1bbfd0cSPeter Zijlstra    (void)atomic_try_cmpxchg(ptr, &old, new);
d1bbfd0cSPeter Zijlstra    return old;
d1bbfd0cSPeter Zijlstra  }
d1bbfd0cSPeter Zijlstra
d1bbfd0cSPeter ZijlstraUsage:
d1bbfd0cSPeter Zijlstra
d1bbfd0cSPeter Zijlstra  old = atomic_read(&v);			old = atomic_read(&v);
d1bbfd0cSPeter Zijlstra  for (;;) {					do {
d1bbfd0cSPeter Zijlstra    new = func(old);				  new = func(old);
d1bbfd0cSPeter Zijlstra    tmp = atomic_cmpxchg(&v, old, new);		} while (!atomic_try_cmpxchg(&v, &old, new));
d1bbfd0cSPeter Zijlstra    if (tmp == old)
d1bbfd0cSPeter Zijlstra      break;
d1bbfd0cSPeter Zijlstra    old = tmp;
d1bbfd0cSPeter Zijlstra  }
d1bbfd0cSPeter Zijlstra
d1bbfd0cSPeter ZijlstraNB. try_cmpxchg() also generates better code on some platforms (notably x86)
d1bbfd0cSPeter Zijlstrawhere the function more closely matches the hardware instruction.
55bccf1fSPeter Zijlstra
55bccf1fSPeter Zijlstra
55bccf1fSPeter ZijlstraFORWARD PROGRESS
55bccf1fSPeter Zijlstra----------------
55bccf1fSPeter Zijlstra
55bccf1fSPeter ZijlstraIn general strong forward progress is expected of all unconditional atomic
55bccf1fSPeter Zijlstraoperations -- those in the Arithmetic and Bitwise classes and xchg(). However
55bccf1fSPeter Zijlstraa fair amount of code also requires forward progress from the conditional
55bccf1fSPeter Zijlstraatomic operations.
55bccf1fSPeter Zijlstra
55bccf1fSPeter ZijlstraSpecifically 'simple' cmpxchg() loops are expected to not starve one another
55bccf1fSPeter Zijlstraindefinitely. However, this is not evident on LL/SC architectures, because
*aae0c8a5SKushagra Vermawhile an LL/SC architecture 'can/should/must' provide forward progress
55bccf1fSPeter Zijlstraguarantees between competing LL/SC sections, such a guarantee does not
55bccf1fSPeter Zijlstratransfer to cmpxchg() implemented using LL/SC. Consider:
55bccf1fSPeter Zijlstra
55bccf1fSPeter Zijlstra  old = atomic_read(&v);
55bccf1fSPeter Zijlstra  do {
55bccf1fSPeter Zijlstra    new = func(old);
55bccf1fSPeter Zijlstra  } while (!atomic_try_cmpxchg(&v, &old, new));
55bccf1fSPeter Zijlstra
55bccf1fSPeter Zijlstrawhich on LL/SC becomes something like:
55bccf1fSPeter Zijlstra
55bccf1fSPeter Zijlstra  old = atomic_read(&v);
55bccf1fSPeter Zijlstra  do {
55bccf1fSPeter Zijlstra    new = func(old);
55bccf1fSPeter Zijlstra  } while (!({
55bccf1fSPeter Zijlstra    volatile asm ("1: LL  %[oldval], %[v]\n"
55bccf1fSPeter Zijlstra                  "   CMP %[oldval], %[old]\n"
55bccf1fSPeter Zijlstra                  "   BNE 2f\n"
55bccf1fSPeter Zijlstra                  "   SC  %[new], %[v]\n"
55bccf1fSPeter Zijlstra                  "   BNE 1b\n"
55bccf1fSPeter Zijlstra                  "2:\n"
55bccf1fSPeter Zijlstra                  : [oldval] "=&r" (oldval), [v] "m" (v)
55bccf1fSPeter Zijlstra		  : [old] "r" (old), [new] "r" (new)
55bccf1fSPeter Zijlstra                  : "memory");
55bccf1fSPeter Zijlstra    success = (oldval == old);
55bccf1fSPeter Zijlstra    if (!success)
55bccf1fSPeter Zijlstra      old = oldval;
55bccf1fSPeter Zijlstra    success; }));
55bccf1fSPeter Zijlstra
55bccf1fSPeter ZijlstraHowever, even the forward branch from the failed compare can cause the LL/SC
55bccf1fSPeter Zijlstrato fail on some architectures, let alone whatever the compiler makes of the C
55bccf1fSPeter Zijlstraloop body. As a result there is no guarantee what so ever the cacheline
55bccf1fSPeter Zijlstracontaining @v will stay on the local CPU and progress is made.
55bccf1fSPeter Zijlstra
55bccf1fSPeter ZijlstraEven native CAS architectures can fail to provide forward progress for their
55bccf1fSPeter Zijlstraprimitive (See Sparc64 for an example).
55bccf1fSPeter Zijlstra
55bccf1fSPeter ZijlstraSuch implementations are strongly encouraged to add exponential backoff loops
55bccf1fSPeter Zijlstrato a failed CAS in order to ensure some progress. Affected architectures are
55bccf1fSPeter Zijlstraalso strongly encouraged to inspect/audit the atomic fallbacks, refcount_t and
55bccf1fSPeter Zijlstratheir locking primitives.